وضعیت کنونی OpenAI
هفتهای پرتنش برای OpenAI بود، با خروجهای مهم اجرایی و پیشرفتهای بزرگ در تأمین مالی. اما این استارتاپ در تلاش است تا توسعهدهندگان را متقاعد کند که ابزارهای جدیدی با مدلهای هوش مصنوعی خود بسازند. در رویداد DevDay 2024، OpenAI چندین ابزار جدید را معرفی کرد، از جمله یک بتای عمومی برای Realtime API، که امکان ایجاد برنامههایی با پاسخهای صوتی تولید شده توسط هوش مصنوعی با تاخیر کم (Low-Latency) را فراهم میکند.
ابزار Realtime API
Realtime API به توسعهدهندگان این امکان را میدهد که تجربههای گفتاری نزدیک به زمان واقعی (Speech-to-Speech) را در برنامههای خود بسازند. این API شامل شش صدای مختلف است که توسط OpenAI ارائه شدهاند. البته، توسعهدهندگان نمیتوانند از صداهای شخص ثالث استفاده کنند تا از مسائل حقوقی جلوگیری شود.
ویژگیهای Realtime API
- تجربهی مکالمه: توسعهدهندگان میتوانند از این API برای ایجاد برنامههایی استفاده کنند که به کاربر اجازه میدهد با یک دستیار هوش مصنوعی درباره سفر به یک شهر خاص مانند لندن صحبت کنند و پاسخهای کمتاخیر دریافت کنند. 🗺️
- انتقال اطلاعات: در دموهایی که ارائه شد، این API توانست به صورت صوتی با کاربر مکالمه کند و اطلاعاتی راجع به مکانهای رستوران در نقشه به دست آورد.
دستاوردهای OpenAI و پاسخ به انتقادات
Kevin Weil، مدیر محصول OpenAI، در یک نشست خبری پیش از رویداد تأکید کرد که خروج میرا مورات (Mira Murati) و باب مکگرو (Bob McGrew) بر پیشرفتهای شرکت تأثیر نخواهد گذاشت. او افزود:
“ما قصد داریم ادامه دهیم و هیچ گونه کندی در فعالیتهای خود نداریم.”
کاهش هزینهها برای توسعهدهندگان
OpenAI اعلام کرده است که هزینههای دسترسی به API خود را در دو سال گذشته تا 99 درصد کاهش داده است، اگرچه به نظر میرسد این کاهش به دلیل رقابت شدید با شرکتهایی مانند متا و گوگل بوده باشد که به طور مداوم قیمتهای خود را کاهش میدهند.
ویژگیهای جدید API
OpenAI در DevDay همچنین ویژگیهای جدید دیگری را معرفی کرد:
- تنظیم دقیق بینایی (Vision Fine-Tuning): این ویژگی به توسعهدهندگان اجازه میدهد از تصاویر و متن برای بهبود عملکرد GPT-4o در وظایف مرتبط با درک بصری استفاده کنند. اما مهم است که توسعهدهندگان نمیتوانند تصاویر تحت حق امتیاز (Copyrighted) را بارگذاری کنند.
- کاشینگ پیشفرض (Prompt Caching): این ویژگی مشابه ویژگیای است که آنتروپیک چند ماه پیش راهاندازی کرده است. توسعهدهندگان با استفاده از این ویژگی میتوانند 50 درصد در هزینهها صرفهجویی کنند.
- تقلیل مدل (Model Distillation): به توسعهدهندگان این امکان را میدهد که از مدلهای بزرگتر مانند o1-preview و GPT-4o برای تنظیم مدلهای کوچکتر مانند GPT-4o mini استفاده کنند. این کار به کاهش هزینهها کمک میکند و عملکرد مدلهای کوچک را بهبود میبخشد.
مواردی که در DevDay مطرح نشد
DevDay همچنین نکات جالبی در مورد آنچه اعلام نشد داشت. برای مثال، خبری از GPT Store که در سال گذشته معرفی شده بود، وجود نداشت. همچنین، OpenAI هیچ مدل هوش مصنوعی جدیدی را در این سال اعلام نکرده است و توسعهدهندگانی که منتظر OpenAI o1 (نسخه معمولی یا مینی) یا مدل تولید ویدئویی Sora هستند، باید کمی بیشتر صبر کنند.
نتیجهگیری
OpenAI با ویژگیها و ابزارهای جدیدی که در DevDay معرفی کرد، تلاش میکند تا همچنان رهبری خود را در زمینه توسعه اپلیکیشنهای هوش مصنوعی حفظ کند. با این حال، باید دید که آیا میتواند در رقابت با دیگر شرکتهای بزرگ این حوزه موفق باشد یا خیر.
برای اطلاعات بیشتر و ثبتنام در وبینارهای مرتبط میتوانید به سایت OpenAI مراجعه کنید.



