AKTSER: ملخص ومفرّغ الرسائل الصوتية على تيليجرام المدعوم بالذكاء الاصطناعي
نظرة عامة
AKTSER هو بوت تيليجرام يقوم بتلخيص الرسائل الصوتية الطويلة، و تحويل الصوت إلى نص، و إزالة الصمت من التسجيل، لكي تتمكن من فهم الرسالة في ثوانٍ بدلاً من دقائق.
اسم AKTSER مشتق من العربية ويعني حرفياً "أكثر" أو "للإيجاز" — تم بناء البوت للأشخاص الذين يعيشون في الملاحظات الصوتية ولكن ليس لديهم دائماً وقت للاستماع إلى كل ثانية.

تحليل شكل الموجة وشدة الصوت المستخدم لضبط عتبات اكتشاف الصمت في AKTSER.
خلف الكواليس، استخدمت مكتبات Python مثل librosa، وnumpy، وmatplotlib لدراسة مستويات الصوت، والضوضاء الخلفية، والمقاطع الصامتة. يسمح هذا التحليل لـ AKTSER بإزالة الفراغات الميتة مع الحفاظ على كل كلمة مهمة في الرسالة.
للتحقق من صحة مسار الإزالة والتلخيص، قمت بإنشاء مجموعة اختبار صغيرة تحاكي رسائل تيليجرام الصوتية الحقيقية باللغتين الإنجليزية والعربية. المقاطع أدناه هي نفس الأصول التي استخدمتها أثناء تطوير وضبط AKTSER.
هكذا يظهر على الهاتف
عرض توضيحي قصير يظهر سير عمل AKTSER بالكامل: إرسال ملاحظة صوتية، واستلامها مع إزالة الصمت اختيارياً.
اضغط للتشغيل / الإيقاف
في هذا المثال، كانت الرسالة الأصلية المولّدة بواسطة الذكاء الاصطناعي بطول 18 ثانية. قامت خوارزمية إزالة الصمت في AKTSER بتخفيضها إلى 11 ثانية—أي تخفيض بنسبة 39٪—عن طريق إزالة الصمت مع الحفاظ على الكلام بشكل مثالي،
يمكنك الاستماع إلى النسخ الأصلية والمعدّلة أدناه:
صوت لرسالة صوتية مولّدة بالذكاء الاصطناعي مع كلام واضح، استُخدم لاختبار الوظائف الأساسية لـ AKTSER.
النسخة المعدّلة من التسجيل الصوتي.
يتميز هذا المقطع بمتحدث يأخذ فترات توقف طويلة أثناء التفكير، مما يختبر قدرة AKTSER على التعامل مع أنماط الكلام الطبيعية وما زال ينتج تلخيصاً وتفريغاً دقيقاً.
إليك التفريغ والملخص الذي أنشأه AKTSER لهذا المقطع:
الاختبار 2 — رسالة صوتية أطول مع فترات توقف مقصودة، استُخدمت لاختبار كيفية تلخيص وتفريغ AKTSER للكلام الذي يتضمن صمتاً وفواصل تفكير.
ملخص الرسالة الصوتية
الموضوع الرئيسي: نقد آراء الناس حول برنامج ما
نقاط مهمة:
- يعتقد البعض أن الضيوف لم يكونوا مُجهزين بشكل جيد
- الناس لا يستمعون ولا يتابعون، فقط ينتقدون
- يجد الضيوف مساحات أفضل لنشر معلوماتهم
- انتشار المعلومات بشكل واسع يدل على قيمتها
ملاحظات:
- عدم وضوح الهدف من الرسالة.
- الحاجة إلى المزيد من التفاصيل.
- ذكر أمثلة على الانتقادات الموجهة
محتوى الرسالة:
يبدو أن الرسالة تتحدث عن انتقادات وُجهت لبرنامج ما. يعتقد البعض أن الضيوف لم يكونوا مُجهزين بشكل جيد وأنّ الناس ينتقدون البرنامج دون الاستماع أو المتابعة. في المقابل، يجد الضيوف مساحات أخرى أفضل لنشر معلوماتهم بشكل أوسع. يرى صاحب الرسالة أن انتشار المعلومات دليل على قيمتها.
الأهداف
- توفير طريقة مريحة لتلخيص الرسائل الصوتية الطويلة على تيليجرام.
- تقديم تحويل من الصوت إلى نص لسهولة القراءة وإمكانية الوصول.
- إزالة الصمت من الرسائل الصوتية لتحسين تجربة الاستماع.
- دعم لغات متعددة لاستخدام أوسع.
المميزات الرئيسية
تلخيص الرسائل الصوتية
يستخرج النقاط الرئيسية من الرسائل الصوتية باستخدام الذكاء الاصطناعي.
تحويل الصوت إلى نص
يفرّغ الرسائل الصوتية إلى نص قابل للقراءة.
إزالة الصمت من الصوت
يزيل الأجزاء الصامتة ومنخفضة الصوت من الرسائل الصوتية.
دعم متعدد اللغات
يعالج الرسائل الصوتية بلغات متعددة.