tmeits / data-mining Goto Github PK
View Code? Open in Web Editor NEWThis project forked from ranalytics/data-mining
Материалы к книге "Классификация, регрессия, и другие алгоритмы Data Mining с использованием R"
This project forked from ranalytics/data-mining
Материалы к книге "Классификация, регрессия, и другие алгоритмы Data Mining с использованием R"
# Классификация, регрессия и другие алгоритмы Data Mining с использованием R ## Аннотация Наряду с сайтом <http://www.ievbras.ru/ecostat/Kiril/R/DM/>, этот репозиторий является вторым официальным местом публикации электронной книги _Шитиков В.К., Мастицкий С.Э. (2017) "Классификация, регрессия и другие алгоритмы Data Mining с использованием R"_. В книге описана широкая совокупность методов построения статистических моделей классификации и регрессии для откликов, измеренных в альтернативной, категориальной и метрической шкалах. Подробно рассматриваются деревья решений, машины опорных векторов с различными разделяющими поверхностями, нелинейные формы дискриминантного анализа, искусственные нейронные сети и т.д. Показана технология применения таких методов бутстреп-агрегирования деревьев решений, как бэггинг, случайный лес и бустинг. Представлены различные методы построения ансамблей моделей для коллективного прогнозирования. Особое внимание уделяется сравнительной оценке эффективности и поиску оптимальных областей значений гиперпараметров моделей с использованием пакета `caret` для статистической среды R. Рассматриваются такие алгоритмы Data Mining, как генерация ассоциативных правил и анализ последовательностей. Отдельная глава посвящена методам многомерной ординации данных и различным алгоритмам кластерного анализа. Описание методов статистического анализа сопровождается многочисленными примерами из различных областей на основе общедоступных исходных данных. Представлены несложные скрипты на языке R, дающие возможность читателю легко воспроизвести все расчеты. Книга может быть использована в качестве учебного пособия по статистическим методам для студентов и аспирантов высших учебных заведений. ## Структура репозитория Репозиторий разбит на следующие директории: * `Book`: содержит PDF-файл книги (`Shitikov_Mastitsky_2017_DM_R.pdf`), а также приложение "Справочная карта по Data Mining" (`Shitikov_Mastitsky_2017_DM_R_Appendix.pdf`); * `Data`: файлы с данными, необходимыми для воспроизведения приведенных в книге примеров; * `Scripts`: листинги кода на языке R к каждой главе, а также папка со сторонними модулями (`Extra_Modules`). ## Онлайн-версия книги Помимо файлов, содержащихся в папке `Book`, книга опубликована также в виде отдельного сайта по адресу <https://ranalytics.github.io/data-mining/> Обратите внимание на то, что содержимое онлайн-версии книги *может незначительно отличаться* от содержимого соответствующего PDF файла. Например: * результаты некоторых вычислений представлены в онлайн-версии более полно; * имеют место небольшие различия в результатах описываемых вычислений, что обусловлено эффектом генератора случайных чисел; * имеют место различия в форматировании текста и рисунков. Однако перечисленные различия не принципиальны и никоим образом не влияют на понимание излагаемого материала. ## Условия распространения Книга распространяется в электронном виде в рамках лицензии Creative Commons ["Атрибуция - Некоммерческое использование - На тех же условиях 4.0 Всемирная"](https://creativecommons.org/licenses/by-nc-sa/4.0/deed.ru). © 2017, Владимир Кириллович Шитиков, Сергей Эдуардович Мастицкий <br> Книга распространяется совершенно бесплатно. Однако если она окажется вам полезной и вы сочтете уместным отблагодарить авторов за их работу, вы можете перечислить любую сумму, воспользовавшись следующей кнопкой (все транзакции выполняются через систему электронных платежей PayPal, наличие у вас аккаунта в этой системе необязательно): [![paypal](https://s3-eu-west-1.amazonaws.com/public-links-and-html-elements/thanks_button.png)](https://www.paypal.com/cgi-bin/webscr?cmd=_s-xclick&hosted_button_id=S4PUCGVTAYUBE) ## Контактная информация В.К. Шитиков Институт экологии Волжского бассейна РАН г. Тольятти, ул. Комзина, 10 Самарская обл., 445003, Россия E-mail: <[email protected]>, <[email protected]> Сайты авторов: <http://www.ievbras.ru/ecostat/Kiril> <http://r-analytics.blogspot.com>
A declarative, efficient, and flexible JavaScript library for building user interfaces.
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
An Open Source Machine Learning Framework for Everyone
The Web framework for perfectionists with deadlines.
A PHP framework for web artisans
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
Some thing interesting about web. New door for the world.
A server is a program made to process requests and deliver data to clients.
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
Some thing interesting about visualization, use data art
Some thing interesting about game, make everyone happy.
We are working to build community through open source technology. NB: members must have two-factor auth.
Open source projects and samples from Microsoft.
Google ❤️ Open Source for everyone.
Alibaba Open Source for everyone
Data-Driven Documents codes.
China tencent open source team.