realestate_cleaning
-
Пример очистки данных снятых из БД по объектам недвижимости
-
В данном задании предполагается работа с файлом TASK_1.
-
На основе первогостолбца данной матрицы необходимо проделать следующие шаги:
-
Если в строчках есть кавычки (два типа кавычек), то оставить только то, что находится внутри них
-
Все пробелы (в том числе, двойные, тройные и т.д.), знаки табуляции, переносы заменить на одиночный пробел
-
Удалить пробелы в начале, и в конце строки
-
Удалить все, что находится в скобках (вместе со скобками)
-
Удалить строчки, содержащие слова "жилой дом"или "таунхаус"
-
Удалить "ЖК"в началах строк
-
Сделать первую букву каждого слова в строках - заглавной
-
Извлечь уникальные значения и сделать таблицу датафреймом, экспортиро-вать ее в формате csv
-
На каждую операцию требуется не больше двух строчек кода в R.
-
Результатомэтого задания должны быть:
-
- csv-файл со списком получившихся значений, безпробелов в начале и конце строк
-
- код