什么是AssemblyAI?
AssemblyAI是一个领先的平台,提供由AI驱动的API,用于转录和理解音频及视频内容。它超越了简单的语音转文本,提供了一套音频智能功能,使开发人员能够大规模分析口语数据。它旨在构建需要处理语音数据的应用程序,从会议转录工具到媒体监控平台。
主要特点
- 高精度转录: 最先进的模型,能够以高精度将语音转换为文本,涵盖各种口音和音频质量。
- 实时流式传输: 实时转录音频,支持实时字幕和声控助手等应用。
- 说话人分离: 在单个音频流中识别并标记不同的说话人。
- 音频智能: 包括情感分析、个人身份信息(PII)编辑、主题检测和内容审核等功能。
- 摘要生成: 自动为长音频文件(如讲座或会议)生成摘要。
- 广泛的语言支持: 支持多种语言和方言的转录。
使用案例
- 会议和通话分析: 转录和分析商务会议、销售电话和客户支持互动,以提取见解。
- 媒体监控: 监控和转录播客、新闻广播和社交媒体视频中的内容。
- 虚拟助手: 通过实时转录为基于语音的用户界面和虚拟助手提供动力。
- 内容创作: 自动为视频和播客生成文字记录,以提高可访问性和SEO。
- 合规与安全: 自动检测并编辑音频记录中的敏感信息(PII)。
入门指南
这是一个使用AssemblyAI Python SDK转录音频文件的简单“Hello World”示例。首先,安装客户端并从AssemblyAI仪表板获取您的API密钥。
```bash pip install assemblyai
然后,您可以运行以下Python代码:
```python import assemblyai as aai
设置您的API密钥
aai.settings.api_key = “您的API密钥”
要转录的音频文件的URL
FILE_URL = “https://storage.googleapis.com/aai-web-samples/espn-bears.m4a”
创建一个转录器对象
transcriber = aai.Transcriber()
开始转录
transcript = transcriber.transcribe(FILE_URL)
if transcript.status == aai.TranscriptStatus.error: print(transcript.error) else: print(transcript.text)
预期输出: “It’s a new era for the Bears…”
定价
AssemblyAI采用免费增值、按需付费的定价模式。它为开发者提供了一个慷慨的免费套餐,包括大量的预录制和实时转录小时数。超出免费套餐后,定价基于每小时处理的音频量。摘要和PII编辑等高级功能作为付费附加组件提供。