海外製品・コンサルテーションサービス UNIPOS(ユニポス) > ソフトウェア > 開発・プログラミング > AISHELL コーパス | 人工知能中国語会話型AI NLP

AISHELL コーパス | 人工知能中国語会話型AI NLP

中国語音声認識に特化したデータセット: 中国 AISHELL社 (Beijing Shell Shell Technology Co., Ltd.) の音声コーパスは、スマートホームや自動車(スマートカー)、ロボットなどのインテリジェント製品向けの音声データに対応したデータセットを提供しています。中国語音声認識に強みがあり、データは用途シーン別にカテゴライズされています。

また学術研究用途向けのオープンソースコーパスも提供されています。

主な用途
- 音声認識システムトレーニング
- 中国語の自然言語処理研究
- 音声合成のデータベース
- マルチモーダル学習のためのデータセット
- 音声アノテーションと解析

データセット
- AISHELL-1: 読み上げ音声を収録したデータセット。音声認識の基礎研究向け
- AISHELL-2: 自然な会話音声を含むデータセット。音声アシスタントの開発に適す
- AISHELL-3: 大規模な多人数話者データを含む、高精度モデル向け
- AISHELL-4: 会議シーンの多チャンネル音声データ。話者分離や会議の音声認識に最適

データソリューション
- 音声認識: 音声を文字に変換する技術の開発に必要なデータ
- 音声合成: テキストを音声に変換するシステム向けのデータ
- 声紋認識: 話者を識別するためのデータ
- 自然言語処理(NLP): テキストデータの処理や理解のためのデータ
- 辞書データ: 言語の発音や意味に関するデータセット

データプロダクトの種類
- インタラクティブデータ: 双方向の対話システムに最適なデータ
- シナリオデータセット: 特定のシナリオに基づいた音声やテキストデータ
- 汎用データセット: 幅広い応用に対応した一般的なデータ
- オープンソースデータ: 研究用に無料で公開されているデータセット

検索キーワード:
エイアイシェルテック / AIShellTech 音声データセット / 中国語音声認識コーパス / AIShell 音声合成データ / AIShellTech ダウンロード / AIShell 研究用データベース / アノテーション / Corpus annotation / 研究用付加情報 / 形態素解析(Morphological analysis) / 自然言語処理 / 構文解析 / ツリーバンク / 大規模注釈付き / ASR / VPR / / NLP / Lexicon / TTS / レキシコン / コンピュータビジョン / OCR / 自動運転 / 音声合成 / 音声認識(Voice Print recognition) / AISHELL-ASR0010 / AISHELL-ASR0020 / AISHELL-ASR0031 / AISHELL-ASR0011 / AISHELL-ASR0012 / AISHELL-ASR0009 / AISHELL-ASR0018 / AISHELL-ASR0026 / AISHELL-1 / AISHELL-2 / AISHELL-EVAL / AISHELL-2019A-EVAL / AISHELL-2019B-EVAL / AISHELL-2019C-EVAL / AISHELL2-2018A-EVAL
メーカー: Beijing Shell Shell Technology Co., Ltd.

AISHELL コーパス | 人工知能中国語会話型AI NLPの見積もり・問い合わせ

「製品について」「導入までの流れ」「価格・お見積り」など、お気軽にお問合せ下さい。

商品名	納品方法	納期	価格
AISHELL コーパス (ご希望の製品名や型番をお知らせください)	電子デリバリー	お問い合わせください	お問い合わせください
サポートパックあんしんプラス(オプション)			製品価格の5～10%/年
サポートパックあんしんプラスとは？

今すぐお見積もり・お問い合わせ

ご希望の商品にチェックを入れてボタンをクリックすることで、該当商品をお見積もりフォームへ追加できます。納品方法についてはこちらをご覧ください。

AISHELL コーパス | 人工知能中国語会話型AI NLPの商品説明

AIShellTech

音声技術の専門家向けの、専門的かつ高度な音声技術製品
多目的で広範な用途に使える中国語をメインとした音声認識のデータセット

製品ベネフィット
- 広範な中国語データセット
- 実世界の音声シナリオカバレッジ
- 多様なアクセントや方言対応
- 高品質な音声アノテーション
- 産業/研究双方での利用可能性

【取り扱い製品の一例】

■ シナリオデータセット / 詳細

音声認識の典型的な使用例
・AISHELL-ASR0010: スマートホーム用音声コマンドコーパス(中国語)
・AISHELL-ASR0020: スマートホーム用音声コマンドコーパス(英語)
・AISHELL-ASR0031: 自動車(EV)用コマンドコーパス(中国語)
・AISHELL-ASR0011: 車両用音声コマンドコーパス(中国語)
・AISHELL-ASR0012: 知能ロボット(スマートロボット)用音声コマンドコーパス(中国語)
・AISHELL-ASR0039: スマートホーム用制御言語コーパス(中国語)
・AISHELL-ASR0070: スマートスピーカー用コーパス(中国語)
・AISHELL-ASR0015: 実際のノイズシーンコーパス(中国語)
・AISHELL-ASR0055: 会議用スピーチコーパス(中国語)
・AISHELL-ASR0037: 会議用スピーチコーパス(中国語)

■ 一般的なデータセット / 詳細

中国語標準語音声コーパス
・AISHELL-ASR0009: 標準語音声コーパス(中国語)
・AISHELL-ASR0060: 高齢者スピーチコーパス(中国語)
・AISHELL-ASR0019: 中国児童音声コーパス(英語)
・AISHELL-ASR0018: 中国児童音声コーパス(中国語)
・AISHELL-VPR0061: 音声認識コーパス(中国語)
・AISHELL-VPR0062: 音声認識コーパス(中国語)
・AISHELL-TTS0013: 感情音声合成コーパス(中国語)
・AISHELL-ASR0026: 音声コーパス(ヒンディー語)
・AISHELL-ASR0006: 中国語アクセントの対話(中国語)
・AISHELL-TTS0006: 中国語 TTS コーパス(中国語)
・AISHELL-ASR0027: 音声コーパス(カザフ語)
・AISHELL-ASR0028: 音声コーパス(アラビア語)
・AISHELL-ASR0029: 音声コーパス(ロシア語)
・AISHELL-ASR0021: アメリカ英語音声コーパス(英語)

■ オープンソース

オープンソースコーパス AISHELL-1 / AISHELL-2 は学術研究用途に対して無料で提供されます。
※商用利用の場合は、メーカーからの許可と購入が必要です。

・AISHELL-1 / 詳細
収録時間: 178時間
話者: 400人
※中国語標準音声データ AISHELL-ASR0009の一部

AISHELL-2 / 詳細
収録時間 : 1,000時間
話者: 1,991人
- 中国語標準音声データ AISHELL-ASR0009- [ZH-CN]の一部 718時間
- 中国語スマートホームボイスデータ AISHELL-ARS0010- [ZH-CN]の一部 282時間

AISHELL-3 / 詳細
マルチスピーカーの中国語 (北京語) 音声コーパス
収録時間 : 85時間
話者: 218人
発話: 88,035

その他: WakeUp-1 / DMASH / AISHELL-6A / AISHELL-6B / RealMAN

■ EVAL (evaluation)

音声認識モデルの性能評価のためのテストデータセット
トレーニングデータ、バリデーションデータ(開発セット)、テストデータが含まれており、
音声及び話者の認識評価などに使用されます

・AISHELL-2018 / 詳細

- AISHELL-2018A-EVAL
テストデータ(Test Data) : 10人による5,000の発話
開発セット(DEV Data): 5人による2,500の発話
サンプリングレート 16kHz / サンプルフォーマット 16bit / 屋内 / データタイプ PCM

・AISHELL-2019 / 詳細

- AISHELL-2019A-EVAL: 遠近マイク音声コーパス
テストデータ(Test Data): 50人の話者による録音
収録時間 24.3時間
サンプリングレート 44.1kHz & 16kHz / サンプルフォーマット 16bit / 屋内 / データタイプ WAV

- AISHELL-2019B-EVAL: スマートアシスタント起動音声データベース(ウェイクアップワード)
テストデータ(Test Data): 86人の話者による録音
収録時間 437.67時間
サンプリングレート 44.1kHz & 16kHz / サンプルフォーマット 16bit / 屋内 / データタイプ WAV

- AISHELL-2019C-EVAL: Alcorrect(瞬間双方向音声翻訳機)音声コーパス
テストデータ(Test Data): 12人の話者による録音
収録時間 31.2時間
サンプリングレート 44.1kHz & 16kHz / サンプルフォーマット 16bit / 屋内 / データタイプ WAV

・AISHELL-2021 / 詳細

- AISHELL-2021A-EVAL: 車載用音声コマンドテストデータセット(EV)
テストデータ(Test Data): 2066人の話者による録音
収録時間 7.2時間
サンプリングレート 16kHz / サンプルフォーマット 16bit / 車両 / データタイプ WAV

- AISHELL-2021B-EVAL: スマートホーム用遠距離音声テストデータセット
テストデータ(Test Data): 30人の話者による録音
収録時間 15.8時間
サンプリングレート 16kHz / サンプルフォーマット 16bit / 屋内 / データタイプ WAV

- AISHELL-2021C-EVAL: 中国語の児童による音声テストデータセット
テストデータ(Test Data): 1117人の話者による録音
収録時間 2.18時間
サンプリングレート 16kHz / サンプルフォーマット 16bit / 屋内 / データタイプ WAV

- AISHELL-2021D-EVAL: 中国語(会話)の音声テストデータセット
テストデータ(Test Data): 6人の話者による録音
収録時間 1.95時間
サンプリングレート 8kHz / サンプルフォーマット 16bit / 屋内 / データタイプ WAV

- AISHELL-2021E-EVAL: 裁判傍聴シーン音声テストデータセット
収録時間 1時間
サンプリングレート 16kHz / サンプルフォーマット 16bit / 屋内 / データタイプ WAV

・AISHELL-2022 / 詳細

- AISHELL-2022A-EVAL: 日本語(会話)のテストデータセット
収録時間 1時間
サンプリングレート 16kHz / サンプルフォーマット 16bit / 屋内 / データタイプ WAV

- AISHELL-2022B-EVAL: 英語(会話)のテストデータセット
収録時間 1時間
サンプリングレート 16kHz / サンプルフォーマット 16bit / 屋内 / データタイプ WAV

- AISHELL-2022C-EVAL: 北京語(中国語)マルチチャネル会議音声テストデータセット
収録時間 12.72時間
サンプリングレート 16kHz / サンプルフォーマット 16bit / 屋内 / データタイプ WAV

※製品の仕様などは変更となる場合がございます。ご了承ください。

メーカー

https://www.aishelltech.com/

ご注文の流れ

ご注文から商品発送までの流れ

商品詳細をご確認の上「今すぐお見積もり・お問い合わせ」ボタンをクリック
見積もりフォームへ必要事項を記載の上、送信ください
弊社よりメールにてお見積りをご提示します
メールへの返信にてご注文の旨をお知らせください
商品代金のお支払いをお願いします(次項の「支払い方法」をご覧ください)
配送、またはメール(電子デリバリー)にて商品をお届けします

詳細はこちら

支払い方法

法人掛売り(※) :
納品・請求書による後払いです。
ご注文手続きはお見積もりメールへの返信のみでけっこうです。
銀行振込:
ご注文の返信メールをいただいた後、弊社指定の銀行口座へのお振込みを確認した時点で注文の確定とさせていただきます。

※法人掛売りでのお支払いについては一定の条件がございます
お支払い方法の詳細はお見積もりメールに記載しておりますので、ご確認ください。

AISHELL コーパス | 人工知能中国語会話型AI NLPの見積もり・問い合わせ

「製品について」「導入までの流れ」「価格・お見積り」など、お気軽にお問合せ下さい。

商品名	納品方法	納期	価格
AISHELL コーパス (ご希望の製品名や型番をお知らせください)	電子デリバリー	お問い合わせください	お問い合わせください
サポートパックあんしんプラス(オプション)			製品価格の5～10%/年
サポートパックあんしんプラスとは？