豊富な言語コーパスを多様な形式で提供『LDC Corpus』テガラ

自然言語処理の研究や機械学習に最適なコーパス。テキスト、音声、レキシコンなど用途に合わせたデータをご利用いただけます。

米国ペンシルバニア大学に本部をおく、LDC(Linguistic Data Consortium)の扱っているコーパスです。

テキストデータベース、音声データベース、レキシコン(辞典)など、豊富な語録とさまざまな形態のデータが揃っています。

自然言語処理研究や、機械学習、自動音声の開発など様々な用途にご利用いただけます。

関連リンク - https://www.unipos.net/find/product_item.php?id=28

基本情報豊富な言語コーパスを多様な形式で提供『LDC Corpus』

【取扱実績の一例】

GALE Phase 4 Chinese Broadcast Conversation Transcripts
LDC Catalog No.: LDC2013S04
DCMI Type(s): Text
Data Source(s): broadcast conversation
Language(s): Mandarin Chinese, Chinese

2000 NIST Speaker Recognition Evaluation
LDC Catalog No.: LDC2001S97
DCMI Type(s): Sound
Data Source(s): telephone speech
Language(s): English

Morphologically Annotated Korean Text
LDC Catalog No.: LDC2004T03
Data Type: text
Data Source(s): newswire
Language(s): Korean

価格情報	LDC Corpusのご購入には、エンドユーザーさまからメーカーに直接コンタクトをとっていただく必要がございます。 ※弊社ではメーカーとお客さまの間でのお支払いの代行を致します。
納期	お問い合わせください
型番・ブランド名	LDC Corpus
用途／実績例	自然言語処理、構文解析、アノテーション、機械学習、自動音声