2009年06月22日
ことえりを賢くする(2)
OpenOfficeを開いて、表計算ドキュメントを選んでください。
ファイルを開いて、とりあえずkihon.uを選択します(まだ開かない)
ファイルの種類から、「テキストCSV」を選んでください。リストの中程にあります。
これで開くと、文字コードと区切り文字を選べます。
文字コードに「日本語EUC」
区切り文字に「スペース」
を選ぶと、ちゃんと区切られ、読める文字になります。
このように読み込めます。
読み込んだら、Dの列は不要なので削除します
Aの列は「読み」
Bの列は「登録単語」
Cの列は「品詞」
です。
が、この形式だとそのまま読み込めないので品詞を書き換えます。
このページを参考にして書き換えを行いました
http://www.hyperteika.com/ime/common/hinsi.html
が、接頭語、接尾語、固有名詞という品詞名はうまく登録されません。
固有名詞は「その他の固有名詞」にすると登録できます。
ひとつ一つはやってられないので、置換で一気に書き換えます。
書き換えが終ったら保存に移ります。
ファイルを開いて、とりあえずkihon.uを選択します(まだ開かない)
ファイルの種類から、「テキストCSV」を選んでください。リストの中程にあります。
これで開くと、文字コードと区切り文字を選べます。
文字コードに「日本語EUC」
区切り文字に「スペース」
を選ぶと、ちゃんと区切られ、読める文字になります。
このように読み込めます。
読み込んだら、Dの列は不要なので削除します
Aの列は「読み」
Bの列は「登録単語」
Cの列は「品詞」
です。
が、この形式だとそのまま読み込めないので品詞を書き換えます。
このページを参考にして書き換えを行いました
http://www.hyperteika.com/ime/common/hinsi.html
が、接頭語、接尾語、固有名詞という品詞名はうまく登録されません。
固有名詞は「その他の固有名詞」にすると登録できます。
ひとつ一つはやってられないので、置換で一気に書き換えます。
書き換えが終ったら保存に移ります。
Posted by ふっかふ〜か at 15:57│Comments(0)
│ことえり