2018年2月4日 Yoshiki Hayama @storywriter
前提: Python がインストールされていること。(Python 2.7.10 で動作確認)
- 分割したいcsvファイルを _.csv という名前で用意する(書式 1列目:id, 2列目:本文)
- 該当csvファイルがあるフォルダに csv_to_files.py を入れる。
- コマンドラインで、該当フォルダに移動し、 python csv_to_files.py と入力する。
- プログラムが src.csv を読み込んで分割し、 ファイルを生成する。
メモ: IBM Watson Discovery 用に Twitter のデータを、大量ファイルに分割したい、というニーズにより作成した。Discovery が単純な txt ファイルに対応していないので、すべて HTML ファイルで生成している。
個人用途のため、不正文字列などのエラー処理はしていない。
IBM Watson Discovery: https://www.ibm.com/watson/services/discovery/