【AI音声文字起こし（β）】操作方法

コンテンツまでスキップ

日本語

GrafferLogoWh

お問い合わせ

機能概要

音声文字起こし機能
- mp3、mp4、wav、m4a形式の音声/動画ファイルをアップロードし、自動で書き起こしを実施します。
文字起こしデータのプロンプトへの流用機能
- 文字起こしデータに対してワンクリックでプロンプトを埋め込み、チャットUIでの生成指示に利用可能です。
- あらかじめ用意されている整形・要約向けプロンプト、テンプレートをご利用いただくことでクリック操作のみでテキスト加工を行うことができます。

操作方法

音声文字起こし画面を表示
音声データアップロード画面を表示
音声データファイルアップロード：
1. ファイルを選択ボタンから音声ファイルをアップロードします（mp3、mp4、wav、m4a形式の音声ファイル / 最大450MBまで）。
2. （任意）最大話者分離数を設定
文字起こしの実行
1. アップロード後、文字起こしを始めるボタンをクリックすることで文字起こし処理が開始されます。（文字起こしが開始されると自動的に一覧画面へ遷移します）
2. 一覧画面で文字起こし状況を確認できます。
3. 完了後、詳細をクリックすることで文字起こし内容を確認できます。
文字起こし内容を加工する
1. プロンプトの埋め込み（テンプレート、整形、要約）
  プロンプトを挿入を選択
  
  遷移後の画面にてその他のアクションから実施アクションを選択
2. チャットへの転記
3. チャット画面でプロンプトと文字起こし結果をご利用いただけます

注意事項

対応ファイルサイズ
- 450MB以下の音声ファイルに対応（mp4の動画データの場合は約1時間の音声データを想定）。
対応ファイル形式
- mp3、mp4、wav、m4a形式の文字起こしに対応しております。
処理時間
- おおよそ、30分ほどの音声ファイルであれば15分程度で、60分を超える音声ファイルであれば20分から30分程度で、文字起こしは完了します。