جیپیتی ۴او
جیپیتی ۴او (به انگلیسی: GPT-4o) («O» بهمعنای «omni») یک ترنسفورمر تولیدگر از پیش آموزشدیده یادگیر چندوجه است که توسط اوپنایآی توسعه یافته و در می ۲۰۲۴ منتشر شده است.[۱] استفاده از جیپیتی ۴او رایگان است اما برای مشترکین چتجیپیتی پلاس محدودیتهای کمتری دارد.[۲] این مدل میتواند متن، تصویر و صدا را پردازش و تولید کند.[۳] واسط برنامهنویسی کاربردی آن (API) دو برابر سریعتر و نصف قیمت نسل قبلی خود یعنی جیپیتی ۴ توربو است.[۱]
توسعهدهنده(ها) | اوپنایآی |
---|---|
انتشار اولیه | ۱۳ مه ۲۰۲۴ |
جایگزین برای | جیپیتی ۴ |
جایگزین شده با | او۱ |
نوع | |
مجوز | نرمافزار مالکیتی |
وبگاه |
پیش زمینه
ویرایشپیش از معرفی رسمی، چندین نسخه از جیپیتی ۴او به صورت مخفیانه تحت نامهای مختلف در سامانههای تست و ارزیابی مدلهای هوش مصنوعی منتشر شده بود. این سه مدل gpt2-chatbot و im-a-good-gpt2-chatbot و im-a-so-a-good-gpt2-chatbot نام داشتند.[۴] در ۷ مه ۲۰۲۴، سم آلتمن توییتی با عنوان «im-a-good-gpt2-chatbot» منتشر کرد که بهطور ضمنی تأیید کرد که مدلهای جدید اوپنایآی در حال آزمون آ/ب هستند.[۵]
قابلیتها
ویرایشجیپیتی ۴او به نتایج پیشرفتهای در معیارهای صوتی، چند زبانه و بینایی دست یافت و رکوردهای جدیدی را در تشخیص و ترجمه گفتار صوتی ثبت کرد.[۶][۷] جیپیتی ۴او در معیار محک امامالیو امتیاز ۸۸٫۷ را در مقایسه با امتیاز ۸۶٫۵ جیپیتی ۴ کسب کرد.[۸] برخلاف جیپیتی ۳٫۵ و جیپیتی ۴ که برای پردازش صدا به مدلهای دیگر متکی بودند، جیپیتی ۴او بهطور بومی از صدا پشتیبانی میکند.[۸] سم آلتمن در ۱۵ مه ۲۰۲۴ اشاره کرد که قابلیتهای صوتی جیپیتی ۴او هنوز در چتجیپیتی ادغام نشده و نسخه قدیمی همچنان در حال استفاده است.[۹][۱۰]
این مدل بیش از ۵۰ زبان را پشتیبانی میکند، [۱] که اوپنایآی مدعی است بیش از ۹۷ درصد از زبانهای در حال گویش جهان را پوشش میدهد.[۱۱] در جریان کنفرانس نمایشی زنده اوپنایآی در ۱۳ مه ۲۰۲۴، میرا موراتی با صحبت کرده به ایتالیایی و سپس و ترجمه مدل بین انگلیسی و ایتالیایی، توانایی چند زبانه مدل را نشان داد. علاوه بر این، این مدل از توکنهای کمتری برای تحلیل واژگانی جدید استفاده میکند که باعث کاهش هزینه تمرین داده برای دیگر زبانها میشود.[۸]
جیپیتی ۴او تا اکتبر ۲۰۲۳ به روز است[۱۲][۱۳] اما در صورت نیاز به اطلاعات به روز تر میتواند به اینترنت دسترسی داشته باشد. جیپیتی ۴او دارای ۱۲۸ هزار توکن است[۱۲] اما توکن خروجی به ۴۰۹۶ محدود شده[۱۳] و پس از به روز رسانی اگوست ۲۰۲۴ به ۱۶٬۳۸۴ توکن.[۱۴]
سفارشی سازی شرکتی
ویرایشدر آگوست ۲۰۲۴، اوپنایآی ویژگی جدیدی را معرفی کرد که به مشتریان شرکتی اجازه میدهد جیپیتی ۴او را با استفاده از دادههای اختصاصی شرکت شخصیسازی کنند. این سفارشیسازی که تنظیم دقیق شناخته میشود، به کسبوکارها امکان میدهد جیپیتی ۴او را با وظایف یا صنایع خاص تطبیق دهند و کاربرد آن را در زمینههایی مانند خدمات مشتری و حوزههای دانش تخصصی افزایش میدهد. پیش از این، تنظیم دقیق تنها در مدل قدیمی تر موجود بود.[۱۵][۱۶]
فرایند تنظیم دقیق، مشتریان را ملزم میکند که دادههای خود را در سرورهای اوپنایآی آپلود کنند و این آموزش داده معمولاً یک تا دو ساعت طول میکشد. در ابتدا، سفارشیسازی به دادههای مبتنی بر متن محدود میشود. تمرکز اوپنایآی بر روی کاهش پیچیدگی و تلاش مورد نیاز برای کسبوکارها برای تطبیق راهحلهای هوش مصنوعی با نیازهایشان است، که بهطور بالقوه پذیرش و اثربخشی هوش مصنوعی را در محیطهای شرکتی افزایش میدهد.[۱۷][۱۵]
جیپیتی ۴او مینی
ویرایشدر ۱۸ ژوئیه ۲۰۲۴، اوپنایآی نسخه کوچکتر و ارزانتر به نام جیپیتی ۴او مینی را منتشر کرد.[۱۸]
طبق گفته اوپنایآی، انتظار میرود هزینه پایین این مدل برای شرکتها، استارتآپها و توسعهدهندگانی که به دنبال ادغام آن در خدمات خود هستند مفید باشد، که اغلب با استفاده از API با مدلها کار میکنند. API این مدل ۰٫۱۵ دلار به ازای هر میلیون توکن ورودی و ۰٫۶ دلار برای هر میلیون توکن خروجی هزینه دارد (در مقایسه با جیپیتی ۴او به ترتیب ۵ و ۱۵ دلار).[۱۸][۱۹]
جیپیتی ۴او مینی در پاییز ۲۰۲۴ در دستگاههای تلفن همراه اپل و رایانههای رومیزی مک از طریق اپل اینتلیجنس در دسترس خواهد بود.[۱۸]
حواشی اسکارلت جوهانسون
ویرایشبعد از انتشار جیپیتی ۴او، این مدل پنج حالت لحن صدا را ارائه میداد اما شباهت یک حالت صدا با لهجه آمریکایی به صدای بازیگر آمریکایی اسکارلت جوهانسون مورد توجه رسانهها قرار گرفت.[۲۰] در ۲۰ مه ۲۰۲۴، اوپنایآی این لحن صدا را غیرفعال کرد و بیانیهای صادر کرد و گفت که در حال بررسی موضوع است.[۲۱]
اسکارلت جوهانسون در سال ۲۰۱۳ در فیلم علمی تخیلی او در نقش یک دستیار مجازی هوش مصنوعی بازی کرده بود که حتی قبل از انتشار جیپیتی ۴او، سم آلتمن نام فیلم را توییت کرده بود.[۲۲][۲۳]
بعدها اوپنایآی ادعا کرد که هر لحن صدا بر اساس صدای یک بازیگر استخدام شده قرار داده شده و این صدا «تقلیدی از اسکارلت جوهانسون نیست، بلکه متعلق به یک بازیگر حرفه ای متفاوت است که از صدای طبیعی خود استفاده کرده است».[۲۱] میرا موراتی در اظهار نظری گفت «در مورد صدا اطلاعی ندارم. در واقع باید بروم و به صدای اسکارلت جوهانسون گوش دهم.» اوپنایآی همچنین اعلام کرد که از قبل با جوهانسون دربارهٔ این موضوع صحبت کرده است.[۲۳]
در ۲۱ ماه مه، جوهانسون بیانیهای صادر کرد و گفت که اوپنایآی مکرراً به او پیشنهاد داده بود تا نه ماه قبل از انتشار جیپیتی ۴او، برای استفاده از صدایش قراردادی ببندد، توافقی که او رد کرد. در ادامه گفت که «شوکه شده، خشمگین است و در کمال ناباوری از اینکه آقای آلتمن صدایی را استفاده کرده که به طرز وحشتناکی شبیه صدای من است که حتی نزدیکترین دوستان و خبرگزاریها هم میتوانند تفاوت را تشخیص دهند.» در این بیانیه، جوهانسون خواستار توجه به فقدان تدابیر قانونی در مورد استفاده از محتواهای خلاقانه برای تقویت ابزارهای هوش مصنوعی شد. جوهانسون همچنین اعلام کرد که از نظر قانونی در حال بررسی شباهت صدای او با این مدل و امکان ثبت شکایت قانونی علیه اوپنایآی است.[۲۳][۲۴]
منابع
ویرایش- ↑ ۱٫۰ ۱٫۱ ۱٫۲ Wiggers, Kyle (2024-05-13). "OpenAI debuts GPT-4o 'omni' model now powering ChatGPT". TechCrunch (به انگلیسی). Retrieved 2024-05-13.
- ↑ Field, Hayden (2024-05-13). "OpenAI launches new AI model GPT-4o and desktop version of ChatGPT". CNBC (به انگلیسی). Retrieved 2024-05-14.
- ↑ Colburn, Thomas. "OpenAI unveils GPT-4o, a fresh multimodal AI flagship model". The Register (به انگلیسی). Retrieved 2024-05-18.
- ↑ Edwards, Benj (2024-05-13). "Before launching, GPT-4o broke records on chatbot leaderboard under a secret name". Ars Technica (به انگلیسی). Retrieved 2024-05-17.
- ↑ Zeff, Maxwell (2024-05-07). "Powerful New Chatbot Mysteriously Returns in the Middle of the Night". Gizmodo (به انگلیسی). Retrieved 2024-05-17.
- ↑ van Rijmenam, Mark (13 May 2024). "OpenAI Launched GPT-4o: The Future of AI Interactions Is Here". The Digital Speaker. Retrieved 17 May 2024.
- ↑ Daws, Ryan (2024-05-14). "GPT-4o delivers human-like AI interaction with text, audio, and vision integration". AI News (به انگلیسی). Retrieved 2024-05-18.
- ↑ ۸٫۰ ۸٫۱ ۸٫۲ "Hello GPT-4o". OpenAI.
- ↑ "OpenAI GPT-4o: How to access GPT-4o voice mode; insights from Sam Altman". The Times of India. 2024-05-16. ISSN 0971-8257. Retrieved 2024-05-18.
- ↑ Morrison, Ryan (2024-07-19). "OpenAI to make GPT-4o Advanced Voice available by the end of the month to select group of users". Tom's Guide (به انگلیسی). Retrieved 2024-09-10.
- ↑ Edwards, Benj (2024-05-13). "Major ChatGPT-4o update allows audio-video talks with an "emotional" AI chatbot". Ars Technica (به انگلیسی). Retrieved 2024-05-17.
- ↑ ۱۲٫۰ ۱۲٫۱ "Models - OpenAI API". OpenAI. Retrieved 17 May 2024.
- ↑ ۱۳٫۰ ۱۳٫۱ Conway, Adam (2024-05-13). "What is GPT-4o? Everything you need to know about the new OpenAI model that everyone can use for free". XDA Developers (به انگلیسی). Retrieved 2024-05-17.
- ↑ "Models".
- ↑ ۱۵٫۰ ۱۵٫۱ "OpenAI lets companies customise its most powerful AI model". South China Morning Post (به انگلیسی). 2024-08-21. Retrieved 2024-08-22.
- ↑ "OpenAI to Let Companies Customize Its Most Powerful AI Model". Bloomberg (به انگلیسی). 2024-08-20. Retrieved 2024-08-22.
- ↑ The Hindu Bureau (2024-08-21). "OpenAI will let businesses customise GPT-4o for specific use cases". The Hindu (به انگلیسی). ISSN 0971-751X. Retrieved 2024-08-22.
- ↑ ۱۸٫۰ ۱۸٫۱ ۱۸٫۲ Franzen, Carl (2024-07-18). "OpenAI unveils GPT-4o mini — a smaller, much cheaper multimodal AI model". VentureBeat (به انگلیسی). Retrieved 2024-07-18.
- ↑ "OpenAI Pricing".
- ↑ Stenzel, Wesley (May 14, 2024). "ChatGPT launching talking AI that sounds exactly like Scarlett Johansson in 'Her' — on purpose?". Entertainment Weekly (به انگلیسی). Retrieved 2024-05-21.
- ↑ ۲۱٫۰ ۲۱٫۱ "How the voices for ChatGPT were chosen". OpenAI. May 19, 2024.
- ↑ "her". X (formerly Twitter). May 13, 2024. Retrieved 2024-05-21.
- ↑ ۲۳٫۰ ۲۳٫۱ ۲۳٫۲ Allyn, Bobby (May 20, 2024). "Scarlett Johansson says she is 'shocked, angered' over new ChatGPT voice". NPR.
- ↑ Mickle, Tripp (2024-05-20). "Scarlett Johansson Said No, but OpenAI's Virtual Assistant Sounds Just Like Her". The New York Times (به انگلیسی). ISSN 0362-4331. Retrieved 2024-05-21.