自然言語処理の研究や機械学習に最適なコーパス。テキスト、音声、レキシコンなど用途に合わせたデータをご利用いただけます。
米国ペンシルバニア大学に本部をおく、LDC(Linguistic Data Consortium)の扱っているコーパスです。
テキストデータベース、音声データベース、レキシコン(辞典)など、豊富な語録とさまざまな形態のデータが揃っています。
自然言語処理研究や、機械学習、自動音声の開発など様々な用途にご利用いただけます。
基本情報豊富な言語コーパスを多様な形式で提供『LDC Corpus』
【取扱実績の一例】
GALE Phase 4 Chinese Broadcast Conversation Transcripts
LDC Catalog No.: LDC2013S04
DCMI Type(s): Text
Data Source(s): broadcast conversation
Language(s): Mandarin Chinese, Chinese
2000 NIST Speaker Recognition Evaluation
LDC Catalog No.: LDC2001S97
DCMI Type(s): Sound
Data Source(s): telephone speech
Language(s): English
Morphologically Annotated Korean Text
LDC Catalog No.: LDC2004T03
Data Type: text
Data Source(s): newswire
Language(s): Korean
価格情報 |
LDC Corpusのご購入には、エンドユーザーさまからメーカーに直接コンタクトをとっていただく必要がございます。 ※弊社ではメーカーとお客さまの間でのお支払いの代行を致します。 |
---|---|
納期 | お問い合わせください |
型番・ブランド名 | LDC Corpus |
用途/実績例 | 自然言語処理、構文解析、アノテーション、機械学習、自動音声 |
取扱企業豊富な言語コーパスを多様な形式で提供『LDC Corpus』
豊富な言語コーパスを多様な形式で提供『LDC Corpus』へのお問い合わせ
お問い合わせ内容をご記入ください。