お役立ちフリーCGI、Perl Module、Perl テクニックなど Perl ネタが中心

形態素解析 エンジン 一覧

blogkid さんが、形態素解析ツールの一覧を記事にしていたのでチェキ!!

ChaSen
 日本語形態素解析システム
CaboCha
 Support Vector Machines に基づく日本語係り受け解析器
JSplitter
 日本語の単語抽出ツール
MeCab
 ChaSenを基に開発された高速な形態素解析器
Sen
 Java 形態素解析エンジン
すもも
 NTT 物性科学基礎研究所で開発された日本語形態素解析システム
 大量の日本語データを高速に形態素解析することを目的
JUMAN
 日本語の解析の研究を目指す多くの研究者に共通に使える形態素解析ツール
Breakfast
 富士通研究所が開発した日本語形態素解析システム
KNP
 日本語文の構文解析を行なうシステム
SUFARY
 suffix arrayというデータ構造を用いて高速な文字列検索を行なう
MACD
 Java RM用いた形態素解析システム
Rosette
 Google、Amazon、Lycos 等名だたるサイトも使っているツール
なるほど、しらないものも沢山あった。中でも最後の Rosette は注目!! この製品、名前だけは聞いたことがありました。

2004年4月17日 | drk | コメント(3)  

コメント(3)

marimoという形態素解析エンジンは
辞書不要なので外国語にも理論的には
対応可能ときいてみすよー

でもフリーではないなぁ

khさん>ちょっとスペイン語については解りかねますが、kakashiみたいに単純な単語切り出しが意外と役立つのではないでしょうか?

スペイン語(ロマンス諸語)のフリーの形態素解析 エンジンはありませんか?

コメントする

CONTACTご相談・お問い合わせ

drk7.jpでは、小規模な CGI 開発から技術支援まで幅広くご相談にのります。

ご相談・お問い合わせはこちら からお気軽にどうぞ。

ページのTOPへ

Copyright © drk7.jp, All Rights Reserved.