جی‌پی‌تی ۴او

مدل چند وجهی از شرکت اوپن‌ای‌آی

جی‌پی‌تی ۴او (به انگلیسی: GPT-4o) («O» به‌معنای «omni») یک ترنسفورمر تولیدگر از پیش آموزش‌دیده یادگیر چندوجه است که توسط اوپن‌ای‌آی توسعه یافته و در می ۲۰۲۴ منتشر شده است.[۱] استفاده از جی‌پی‌تی ۴او رایگان است اما برای مشترکین چت‌جی‌پی‌تی پلاس محدودیت‌های کمتری دارد.[۲] این مدل می‌تواند متن، تصویر و صدا را پردازش و تولید کند.[۳] واسط برنامه‌نویسی کاربردی آن (API) دو برابر سریعتر و نصف قیمت نسل قبلی خود یعنی جی‌پی‌تی ۴ توربو است.[۱]

ترنسفورمر تولیدگر از پیش آموزش‌دیده ۴ اومنای
(جی‌پی‌تی ۴او)
توسعه‌دهنده(ها)اوپن‌ای‌آی
انتشار اولیه۱۳ مه ۲۰۲۴؛ ۵ ماه پیش (۲۰۲۴-13}})
جایگزین برایجی‌پی‌تی ۴
جایگزین شده بااو۱
نوع
مجوزنرم‌افزار مالکیتی
وبگاه

پیش زمینه

ویرایش

پیش از معرفی رسمی، چندین نسخه از جی‌پی‌تی ۴او به صورت مخفیانه تحت نام‌های مختلف در سامانه‌های تست و ارزیابی مدل‌های هوش مصنوعی منتشر شده بود. این سه مدل gpt2-chatbot و im-a-good-gpt2-chatbot و im-a-so-a-good-gpt2-chatbot نام داشتند.[۴] در ۷ مه ۲۰۲۴، سم آلتمن توییتی با عنوان «im-a-good-gpt2-chatbot» منتشر کرد که به‌طور ضمنی تأیید کرد که مدل‌های جدید اوپن‌ای‌آی در حال آزمون آ/ب هستند.[۵]

قابلیت‌ها

ویرایش

جی‌پی‌تی ۴او به نتایج پیشرفته‌ای در معیارهای صوتی، چند زبانه و بینایی دست یافت و رکوردهای جدیدی را در تشخیص و ترجمه گفتار صوتی ثبت کرد.[۶][۷] جی‌پی‌تی ۴او در معیار محک ام‌ام‌ال‌یو امتیاز ۸۸٫۷ را در مقایسه با امتیاز ۸۶٫۵ جی‌پی‌تی ۴ کسب کرد.[۸] برخلاف جی‌پی‌تی ۳٫۵ و جی‌پی‌تی ۴ که برای پردازش صدا به مدل‌های دیگر متکی بودند، جی‌پی‌تی ۴او به‌طور بومی از صدا پشتیبانی می‌کند.[۸] سم آلتمن در ۱۵ مه ۲۰۲۴ اشاره کرد که قابلیت‌های صوتی جی‌پی‌تی ۴او هنوز در چت‌جی‌پی‌تی ادغام نشده و نسخه قدیمی همچنان در حال استفاده است.[۹][۱۰]

این مدل بیش از ۵۰ زبان را پشتیبانی می‌کند، [۱] که اوپن‌ای‌آی مدعی است بیش از ۹۷ درصد از زبان‌های در حال گویش جهان را پوشش می‌دهد.[۱۱] در جریان کنفرانس نمایشی زنده اوپن‌ای‌آی در ۱۳ مه ۲۰۲۴، میرا موراتی با صحبت کرده به ایتالیایی و سپس و ترجمه مدل بین انگلیسی و ایتالیایی، توانایی چند زبانه مدل را نشان داد. علاوه بر این، این مدل از توکن‌های کمتری برای تحلیل واژگانی جدید استفاده می‌کند که باعث کاهش هزینه تمرین داده برای دیگر زبان‌ها می‌شود.[۸]

جی‌پی‌تی ۴او تا اکتبر ۲۰۲۳ به روز است[۱۲][۱۳] اما در صورت نیاز به اطلاعات به روز تر می‌تواند به اینترنت دسترسی داشته باشد. جی‌پی‌تی ۴او دارای ۱۲۸ هزار توکن است[۱۲] اما توکن خروجی به ۴۰۹۶ محدود شده[۱۳] و پس از به روز رسانی اگوست ۲۰۲۴ به ۱۶٬۳۸۴ توکن.[۱۴]

سفارشی سازی شرکتی

ویرایش

در آگوست ۲۰۲۴، اوپن‌ای‌آی ویژگی جدیدی را معرفی کرد که به مشتریان شرکتی اجازه می‌دهد جی‌پی‌تی ۴او را با استفاده از داده‌های اختصاصی شرکت شخصی‌سازی کنند. این سفارشی‌سازی که تنظیم دقیق شناخته می‌شود، به کسب‌وکارها امکان می‌دهد جی‌پی‌تی ۴او را با وظایف یا صنایع خاص تطبیق دهند و کاربرد آن را در زمینه‌هایی مانند خدمات مشتری و حوزه‌های دانش تخصصی افزایش می‌دهد. پیش از این، تنظیم دقیق تنها در مدل قدیمی تر موجود بود.[۱۵][۱۶]

فرایند تنظیم دقیق، مشتریان را ملزم می‌کند که داده‌های خود را در سرورهای اوپن‌ای‌آی آپلود کنند و این آموزش داده معمولاً یک تا دو ساعت طول می‌کشد. در ابتدا، سفارشی‌سازی به داده‌های مبتنی بر متن محدود می‌شود. تمرکز اوپن‌ای‌آی بر روی کاهش پیچیدگی و تلاش مورد نیاز برای کسب‌وکارها برای تطبیق راه‌حل‌های هوش مصنوعی با نیازهایشان است، که به‌طور بالقوه پذیرش و اثربخشی هوش مصنوعی را در محیط‌های شرکتی افزایش می‌دهد.[۱۷][۱۵]

جی‌پی‌تی ۴او مینی

ویرایش

در ۱۸ ژوئیه ۲۰۲۴، اوپن‌ای‌آی نسخه کوچکتر و ارزانتر به نام جی‌پی‌تی ۴او مینی را منتشر کرد.[۱۸]

طبق گفته اوپن‌ای‌آی، انتظار می‌رود هزینه پایین این مدل برای شرکت‌ها، استارت‌آپ‌ها و توسعه‌دهندگانی که به دنبال ادغام آن در خدمات خود هستند مفید باشد، که اغلب با استفاده از API با مدل‌ها کار می‌کنند. API این مدل ۰٫۱۵ دلار به ازای هر میلیون توکن ورودی و ۰٫۶ دلار برای هر میلیون توکن خروجی هزینه دارد (در مقایسه با جی‌پی‌تی ۴او به ترتیب ۵ و ۱۵ دلار).[۱۸][۱۹]

جی‌پی‌تی ۴او مینی در پاییز ۲۰۲۴ در دستگاه‌های تلفن همراه اپل و رایانه‌های رومیزی مک از طریق اپل اینتلیجنس در دسترس خواهد بود.[۱۸]

حواشی اسکارلت جوهانسون

ویرایش

بعد از انتشار جی‌پی‌تی ۴او، این مدل پنج حالت لحن صدا را ارائه می‌داد اما شباهت یک حالت صدا با لهجه آمریکایی به صدای بازیگر آمریکایی اسکارلت جوهانسون مورد توجه رسانه‌ها قرار گرفت.[۲۰] در ۲۰ مه ۲۰۲۴، اوپن‌ای‌آی این لحن صدا را غیرفعال کرد و بیانیه‌ای صادر کرد و گفت که در حال بررسی موضوع است.[۲۱]

اسکارلت جوهانسون در سال ۲۰۱۳ در فیلم علمی تخیلی او در نقش یک دستیار مجازی هوش مصنوعی بازی کرده بود که حتی قبل از انتشار جی‌پی‌تی ۴او، سم آلتمن نام فیلم را توییت کرده بود.[۲۲][۲۳]

بعدها اوپن‌ای‌آی ادعا کرد که هر لحن صدا بر اساس صدای یک بازیگر استخدام شده قرار داده شده و این صدا «تقلیدی از اسکارلت جوهانسون نیست، بلکه متعلق به یک بازیگر حرفه ای متفاوت است که از صدای طبیعی خود استفاده کرده است».[۲۱] میرا موراتی در اظهار نظری گفت «در مورد صدا اطلاعی ندارم. در واقع باید بروم و به صدای اسکارلت جوهانسون گوش دهم.» اوپن‌ای‌آی همچنین اعلام کرد که از قبل با جوهانسون دربارهٔ این موضوع صحبت کرده است.[۲۳]

در ۲۱ ماه مه، جوهانسون بیانیه‌ای صادر کرد و گفت که اوپن‌ای‌آی مکرراً به او پیشنهاد داده بود تا نه ماه قبل از انتشار جی‌پی‌تی ۴او، برای استفاده از صدایش قراردادی ببندد، توافقی که او رد کرد. در ادامه گفت که «شوکه شده، خشمگین است و در کمال ناباوری از اینکه آقای آلتمن صدایی را استفاده کرده که به طرز وحشتناکی شبیه صدای من است که حتی نزدیک‌ترین دوستان و خبرگزاری‌ها هم می‌توانند تفاوت را تشخیص دهند.» در این بیانیه، جوهانسون خواستار توجه به فقدان تدابیر قانونی در مورد استفاده از محتواهای خلاقانه برای تقویت ابزارهای هوش مصنوعی شد. جوهانسون همچنین اعلام کرد که از نظر قانونی در حال بررسی شباهت صدای او با این مدل و امکان ثبت شکایت قانونی علیه اوپن‌ای‌آی است.[۲۳][۲۴]

منابع

ویرایش
  1. ۱٫۰ ۱٫۱ ۱٫۲ Wiggers, Kyle (2024-05-13). "OpenAI debuts GPT-4o 'omni' model now powering ChatGPT". TechCrunch (به انگلیسی). Retrieved 2024-05-13.
  2. Field, Hayden (2024-05-13). "OpenAI launches new AI model GPT-4o and desktop version of ChatGPT". CNBC (به انگلیسی). Retrieved 2024-05-14.
  3. Colburn, Thomas. "OpenAI unveils GPT-4o, a fresh multimodal AI flagship model". The Register (به انگلیسی). Retrieved 2024-05-18.
  4. Edwards, Benj (2024-05-13). "Before launching, GPT-4o broke records on chatbot leaderboard under a secret name". Ars Technica (به انگلیسی). Retrieved 2024-05-17.
  5. Zeff, Maxwell (2024-05-07). "Powerful New Chatbot Mysteriously Returns in the Middle of the Night". Gizmodo (به انگلیسی). Retrieved 2024-05-17.
  6. van Rijmenam, Mark (13 May 2024). "OpenAI Launched GPT-4o: The Future of AI Interactions Is Here". The Digital Speaker. Retrieved 17 May 2024.
  7. Daws, Ryan (2024-05-14). "GPT-4o delivers human-like AI interaction with text, audio, and vision integration". AI News (به انگلیسی). Retrieved 2024-05-18.
  8. ۸٫۰ ۸٫۱ ۸٫۲ "Hello GPT-4o". OpenAI.
  9. "OpenAI GPT-4o: How to access GPT-4o voice mode; insights from Sam Altman". The Times of India. 2024-05-16. ISSN 0971-8257. Retrieved 2024-05-18.
  10. Morrison, Ryan (2024-07-19). "OpenAI to make GPT-4o Advanced Voice available by the end of the month to select group of users". Tom's Guide (به انگلیسی). Retrieved 2024-09-10.
  11. Edwards, Benj (2024-05-13). "Major ChatGPT-4o update allows audio-video talks with an "emotional" AI chatbot". Ars Technica (به انگلیسی). Retrieved 2024-05-17.
  12. ۱۲٫۰ ۱۲٫۱ "Models - OpenAI API". OpenAI. Retrieved 17 May 2024.
  13. ۱۳٫۰ ۱۳٫۱ Conway, Adam (2024-05-13). "What is GPT-4o? Everything you need to know about the new OpenAI model that everyone can use for free". XDA Developers (به انگلیسی). Retrieved 2024-05-17.
  14. "Models".
  15. ۱۵٫۰ ۱۵٫۱ "OpenAI lets companies customise its most powerful AI model". South China Morning Post (به انگلیسی). 2024-08-21. Retrieved 2024-08-22.
  16. "OpenAI to Let Companies Customize Its Most Powerful AI Model". Bloomberg (به انگلیسی). 2024-08-20. Retrieved 2024-08-22.
  17. The Hindu Bureau (2024-08-21). "OpenAI will let businesses customise GPT-4o for specific use cases". The Hindu (به انگلیسی). ISSN 0971-751X. Retrieved 2024-08-22.
  18. ۱۸٫۰ ۱۸٫۱ ۱۸٫۲ Franzen, Carl (2024-07-18). "OpenAI unveils GPT-4o mini — a smaller, much cheaper multimodal AI model". VentureBeat (به انگلیسی). Retrieved 2024-07-18.
  19. "OpenAI Pricing".
  20. Stenzel, Wesley (May 14, 2024). "ChatGPT launching talking AI that sounds exactly like Scarlett Johansson in 'Her' — on purpose?". Entertainment Weekly (به انگلیسی). Retrieved 2024-05-21.
  21. ۲۱٫۰ ۲۱٫۱ "How the voices for ChatGPT were chosen". OpenAI. May 19, 2024.
  22. "her". X (formerly Twitter). May 13, 2024. Retrieved 2024-05-21.
  23. ۲۳٫۰ ۲۳٫۱ ۲۳٫۲ Allyn, Bobby (May 20, 2024). "Scarlett Johansson says she is 'shocked, angered' over new ChatGPT voice". NPR.
  24. Mickle, Tripp (2024-05-20). "Scarlett Johansson Said No, but OpenAI's Virtual Assistant Sounds Just Like Her". The New York Times (به انگلیسی). ISSN 0362-4331. Retrieved 2024-05-21.