ما هو Deepgram؟
Deepgram هي منصة رائدة في تحويل الكلام إلى نص باستخدام الذكاء الاصطناعي تمكّن المطورين من بناء تطبيقات تدعم الصوت بقدرات نسخ عالية الدقة وفي الوقت الفعلي. تشتهر Deepgram بسرعتها وموثوقيتها وواجهة برمجة التطبيقات سهلة الاستخدام للمطورين، حيث تعالج كل من الصوت المسجل مسبقًا وتدفقات الصوت الحية، مما يجعلها خيارًا شائعًا لمجموعة واسعة من حالات الاستخدام، من مراكز الاتصال إلى نسخ الوسائط.
الميزات الرئيسية
- سرعة فائقة: تقدم واحدة من أقل فترات الكمون في الصناعة، مما يجعلها مثالية للتطبيقات في الوقت الفعلي مثل المساعدين الصوتيين والترجمة الحية.
- دقة عالية: مدعومة بنماذج تعلم عميق شاملة، بما في ذلك نموذجها الرائد “Nova-2”، لتوفير دقة نسخ حديثة.
- تمييز المتحدثين: تحدد وتصنف المتحدثين المختلفين في بث صوتي واحد.
- تنسيق ذكي: تقوم بتنسيق النصوص تلقائيًا بعلامات الترقيم والأرقام والتواريخ والمزيد لتحسين القراءة.
- مفردات مخصصة وحجب المعلومات: تسمح للمستخدمين بتعزيز الدقة لكلمات رئيسية معينة (مثل أسماء المنتجات) وحجب المعلومات الحساسة من النصوص.
- دعم متعدد اللغات: تدعم النسخ بلغات ولهجات عديدة.
حالات الاستخدام
- تحليلات مراكز الاتصال: نسخ وتحليل مكالمات العملاء لاستخلاص الرؤى ومراقبة أداء الوكلاء وضمان الامتثال.
- نسخ الوسائط: إنشاء تسميات توضيحية ونصوص دقيقة للبودكاست ومقاطع الفيديو والبث لتحسين إمكانية الوصول والبحث.
- الذكاء الاصطناعي الحواري وروبوتات الصوت: تشغيل واجهات المستخدم القائمة على الصوت مع تعرف سريع وموثوق على الكلام.
- ذكاء المبيعات والاجتماعات: تسجيل ونسخ وتحليل مكالمات المبيعات والاجتماعات لتحديد الموضوعات الرئيسية وبنود العمل وفرص التدريب.
البدء
إليك مثال بسيط “Hello World” باستخدام حزمة تطوير البرامج (SDK) الخاصة بـ Deepgram بلغة Python لنسخ ملف صوتي مسجل مسبقًا من عنوان URL.
أولاً، قم بتثبيت حزمة SDK: ```bash pip install deepgram-sdk
بعد ذلك، قم بتعيين مفتاح واجهة برمجة التطبيقات الخاص بـ Deepgram كمتغير بيئة (DEEPGRAM_API_KEY). ثم قم بتشغيل البرنامج النصي التالي بلغة Python:
```python from dotenv import load_dotenv import os from deepgram import DeepgramClient, PrerecordedOptions
load_dotenv()
عنوان URL للملف الصوتي الذي تريد نسخه
AUDIO_URL = “https://static.deepgram.com/examples/Bueller-Life-moves-pretty-fast.wav”
def main(): try: # إنشاء عميل Deepgram باستخدام مفتاح API api_key = os.getenv(“DEEPGRAM_API_KEY”) deepgram = DeepgramClient(api_key)
# تكوين خيارات Deepgram
options = PrerecordedOptions(
model="nova-2",
smart_format=True,
)
# استدعاء طريقة transcribe_url
response = deepgram.listen.prerecorded.v("1").transcribe_url(
{"url": AUDIO_URL}, options
)
# طباعة النص
print(response.to_json(indent=4))
except Exception as e:
print(f"Exception: {e}")
if name == “main”: main()
سيقوم هذا البرنامج النصي بإرسال عنوان URL الصوتي إلى Deepgram وطباعة نص JSON الناتج، والذي يتضمن النص وبيانات وصفية أخرى.
التسعير
تعمل Deepgram بنموذج تسعير مجاني يعتمد على الدفع حسب الاستخدام. يحصل المستخدمون الجدد على قدر كبير من الأرصدة المجانية للبدء. بعد استخدام الأرصدة المجانية، تعتمد الفوترة على عدد دقائق الصوت المعالجة، بأسعار مختلفة لنماذجها وميزاتها المتنوعة. تتوفر أيضًا خطط للمؤسسات بأسعار وميزات مخصصة.