حتماً سیری یا دستیار صوتی گوگل یا حتی آمازون را میشناسید و با آنها کارکردید. امروزه همگی آنها بسیار خوب کار میکنند. تا جایی که میتوانند بهراحتی و با سرعت دستورات صوتی را پردازش کنند. ولی همانطور که میدانید، این دستیارهای صوتی، برای کار کردن نیاز به اینترنت دارند. اکنون میخواهیم یک چیپ هشت دلاری را معرفی کنیم (LU-ASR01) که امکان پردازش صدا بهصورت آفلاین را در اختیار ما قرار میدهد!
بورد موردبحث که LU-ASR01 نام دارد، برای تشخیص گفتار از یک میکروفون داخلی بهره میگیرد. این بورد همچنین مجهز به یک کانکتور اسپیکر، 12 سوراخ برای GPIO، یک رابط برای سنسورهای دماسنج DHT11/DS18B20 و یک پورت USB Type-C برای تغذیه و ریختن برنامه است. برخلاف چیزی که گمان میرفت و در ماژولهای تشخیص صدای ارزانقیمت دیگر دیدهشده بود، این بورد براساس میکروکنترلر Unisound US516P6 طراحی نشده است بلکه از یک چیپ TW-ASR ONE بهره میگیرد. برای بررسی دقیقتر با سیسوگ همراه شوید.
مشخصات و ویژگیهای برد LU-ASR01
در ادامه برخی ویژگیهای بورد LU-ASR01 که قابل دسترسی بودند را ذکر میکنیم:
- MCU – TW-ASR ONE (aka TWen ASR ONE) microcontroller with 4MB flash, 512KB RAM, and a BNPU for voice processing; package: QFN48L (6x6x0.85mm)
- Audio I/O
- Built-in microphone
- 2-pin speaker header plus 3W power amplifier for 4Ω/3W speaker
- Voice recognition
- Up to 10 meters wake-up range
- 98% ultra-high recognition rate
- Customizable to 5 wake-up words and 200 recognition words
- USB – 1x USB Type-C port for power and programming via CH340C USB to TTL chip
- Expansion – 12x through holes with 8x GPIOs, of which 6 can be used as PWM, one serial Tx, one DHT11/DS18B20 temperature sensor interface
- Dimensions – About 3.7 x 3.7 cm
- Weight – 35g
بخش مهمی از اطلاعات بهدستآمده از بورد LU-ASR01، تعدادی داکیومنت و ویدیوی آموزشی به زبان چینی است که Banggood در یک فایل RAR به اشتراک گذاشته است. برای برنامهریزی بورد، باید نرمافزار TwenBlock را دانلود کرد که براساس Blockly نوشتهشده است و امکان برنامهنویسی بهصورت گرافیکی را فراهم میکند.
تمامی اعمال مربوط به برنامهریزی کلمه “بیدار کردن” دستگاه تا دستورات صوتی دیگر و همچنین مانیتور کردن دما و کنترل کردن I/O ها، در همین محیط انجام میشود. برنامه نوشتهشده در این نرمافزار، Build میشود و از طریق USB به حافظه Flash بورد منتقل میگردد. قابلذکر است که امکان ویرایش سورس کد خروجی Blockly بهصورت مستقیم وجود دارد اما تا جایی که اطلاع داریم برای این منظور پشتیبانی از زبانی بهجز Mandarin چینی تأیید نشده است.
قابلذکر است که یک آموزش 5 قسمتی دیگر در شبکه اجتماعی Zhinu نیز برای بورد LU-ASR01 وجود دارد که البته آنهم به زبان چینی است. بااینحال این آموزش نسبت به اطلاعات موجود در فایل RAR مزیتهایی دارد، ازجمله اینکه اطلاعات این آموزشها جزییات بیشتری دارند و مهمتر از آن، ازآنجاییکه کاملاً بهصورت نوشتاری هستند بهراحتی توسط کامپیوتر قابل ترجمه و استفاده هستند. در ادامه بلاک دیاگرامی از میکروکنترلر ASR ONE آورده شده است. طبق اطلاعات بهدستآمده این سیستم امکان استفاده FreeRTOS را نیز دارد.
البته دیاگرام بالا مربوط به بورد ASR ONE v0.1 دیگری است که به بورد NodeMCU شباهت دارد.
خبر خوب اینکه بورد تشخیص گفتار آفلاین LU-ASR01 در حال حاضر از Banggood با قیمت 7.99 دلار قابل سفارش است. البته بعضی فروشگاههای دیگر این بورد را با عنوان “ارتقایی بر بورد VRM LD3320 بر پایه LD3320A” و قیمتی بالاتر از 20 دلار، به فروش گذاشتهاند.
با تشکر
هنوز اطلاعات بیشتری از نحوه کار با این ماژول پیدا نشده ؟ چون من هر چی سرچ می کنم به جز همون فایل Rar چیز دیگه ای نیست. من ماژول رو تهیه کردم اما هنوز نتونستم راه اندازی کنم .
ممنون می شم اگر شما به اطلاعات بیشتری دست پیدا کردین به اشتراک بگذارید
خواهش میکنم
متاسفانه ما هم اطلاعاتی نداریم
اما پیشنهاد میکنم از ماژول vc 02 استفاده کنید که توسط ما هم راه اندازی شده و تست شده و فایل هاش موجود هست
https://sisoog.com/2023/06/07/use-ai-thinker-vc-02/
سلام چجوری LU-ASR01 بوردی با قابلیت پردازش صدا به شکل آفلاین این برد رو خریداری کنم از کجا اگه شما این برد رو دارید لطفاً تماس بگیرید 09902308500
سلام دوست عزیز
شما میتونید از سایت هایی که سفارش خارجی قبول میکنند قطعه مورد نظرتون رو تامین کنید
سایت هایی مثل اسکای تک 🙂
ممنون از شما
کار با این برد ها به چه صورتی هست ؟
یعنی خودش یکسری زبان ها رو پشتیبانی میکنه ؟
مثلا این الان از چه زبان هایی پشتیبانی میکنه؟
یا جوری هستند که خودمون بتونیم مثلا پشتیبانی از فارسی رو اضافه کنیم بهشون
سلام دوست عزیز، خوشحالم که این مطلب مورد توجه شما بوده.
در پاسخ به سوالاتون باید بگم که جوری که من متوجه شدم، دست کم طبق اطلاعات فعلی محدودیتی برای پردازش زبان خاصی قید نشده و میشه فرمانهای صوتی زبان مورد نظر رو توی همون محیط TwenBlock تنظیم کرد. در نتیجه باید امکان استفاده از زبان فارسی هم وجود داشته باشه.
باز هم اگر به اطلاعات دقیقتری در این رابطه دست پیدا کردم، توی همین قسمت اضافه میکنم.