فهرست مقاله
🚀【AIانقلاب جهانی] GPT-4o مورد علاقه جدید OpenAI رونمایی شد و قابلیتهای پردازش صدا و ویدئو آن مخاطبان را شوکه کرد! 🌟
GPT-4o، یک مدل کاملاً جدید هوش مصنوعی، نه تنها حکمت GPT-4 را دارد، بلکه میتواند تفسیر لحظهای را نیز انجام دهد و به افراد زبانهای مختلف اجازه میدهد تا به راحتی با هم ارتباط برقرار کنند. ظهور آن به طور کامل نحوه تعامل ما با هوش مصنوعی را تغییر خواهد داد. بیایید و جذابیت فناوری آینده را که توسط GPT-4o ارائه شده است، تجربه کنید! 🌐
OpenAI مدل جدید GPT-4o را منتشر کرد
یک روز قبل از راه اندازی Google I/O، OpenAI بدون تشریفات توجه را به خود جلب کرد و در عرضه نسل جدید مدل GPT-4o پیشتاز شد. این مدل جدید نه تنها حکمت GPT-4 را به ارث برده است، بلکه دارای قابلیت های پردازش صوتی و تصویری قوی تری است و به کاربران این احساس را می دهد که تقریباً با یک شخص واقعی در تعامل هستند.
ویژگی خاص GPT-4o را می توان از نام آن متوجه شد. "o" در اینجا مخفف "omni" است که به معنای "قدرت مطلق" است که نشان دهنده قابلیت های همه جانبه مدل جدید در استدلال متنی، صوتی و تصویری است. OpenAI در بیانیه ای اعلام کرد: «ما مفتخریم که GPT-4o، مدل پرچمدار جدید خود را که قادر به پردازش صدا، تصویر و متن در زمان واقعی است، معرفی می کنیم.
توانایی پاسخگویی GPT-4o نزدیک به انسان است، "مانند هوش مصنوعی در فیلم"
اگرچه GPT-4 همچنین می تواند تصاویر را تشخیص دهد و تبدیل متن و گفتار را انجام دهد، این توابع در گذشته در مدل های مختلف پراکنده شده اند و در نتیجه زمان پاسخگویی طولانی را به همراه داشته اند. GPT-4o این توابع را در یک مدل ادغام می کند که به آن "مدل همه منظوره" می گویند. در مقایسه با نسل قبلی پرچمدار GPT-4 Turbo، GPT-4o در زبان انگلیسی و زبان های برنامه نویسی عملکرد مشابهی دارد، اما عملکرد قابل توجهی در زبان های دیگر، API های سریع تر و تا 50 درصد هزینه کمتر را بهبود بخشیده است.
OpenAI指出,GPT-4o的回应时间接近人类,能提供更自然的沟通体验,最快可在232毫秒(0.232秒)、平均320毫秒(0.32秒)内响应问题。作为对比,GPT-3.5和GPT-4在语音模式下的回应时间分别为2.8秒和5.4秒。
در نمایش OpenAI، GPT-4o قادر به تفسیر در زمان واقعی بود و به دو نفر به زبانهای مختلف اجازه میداد بدون مانع با هم ارتباط برقرار کنند. یا وقتی از GPT-4o میخواهید داستانی را قبل از خواب تعریف کند، میتواند آن را واضحتر با صدایی کاملتر و احساسیتر بگوید یا میتواند از لحن تقریباً انسانی برای آموزش حل مسائل ساده ریاضی استفاده کند.

طبق گفته OpenAI، GPT-4o میتواند عبارات و لحن کاربر را بخواند، بداند چه زمانی و چگونه پاسخ دهد، و میتواند به سرعت بین زنگهای مختلف، از صدای مکانیکی سرد گرفته تا آهنگی شاد، جابجا شود. میرا موراتی، مدیر فنی OpenAI گفت که توسعه GPT-4o از فرآیند مکالمه انسانی الهام گرفته شده است، "وقتی صحبت نمی کنید، نوبت من است که صحبت کنم. من می توانم لحن و پاسخ شما را بخوانم. این بسیار طبیعی، غنی و تعاملی است. ”
سام آلتمن، مدیر عامل OpenAI در وبلاگی گفت: "حالت های صوتی و تصویری جدید بهترین رابط های کامپیوتری هستند که من تا به حال از آن استفاده کرده ام، درست مانند هوش مصنوعی در فیلم. من حتی نمی توانم آن را باور کنم. واقعاً، معلوم است که چگونه است. تغییرات چشمگیر در زمان پاسخ و بیان برای رسیدن به سطوح انسانی است."
اگرچه همه چیز در طول تظاهرات عالی نبود، GPT-4o گاهی اوقات صحبت های دیگران را در حین نمایش قطع می کرد و حتی در مورد لباس میزبان بدون اینکه از او سؤال شود، اظهار نظر می کرد، اما پس از اصلاح مجری به سرعت به حالت عادی بازگشت.
مولاتی فاش کرد که از طریق قدرت مدل همه جانبه، فناوری GPT در آینده بیشتر بهبود خواهد یافت، به عنوان مثال، پس از تماشای پخش رویدادهای ورزشی، قوانین رقابت را برای کاربران توضیح می دهد و دیگر محدود به آن نخواهد بود کارهای ساده مانند ترجمه عکس و متن.
OpenAI گفت که کاربران اکنون می توانند از GPT-4o در نسخه رایگان استفاده کنند، در حالی که مشترکین پرداختی پنج برابر محدودیت پیام نسخه رایگان خواهند داشت. انتظار می رود که سرویس صوتی مبتنی بر GPT-4o در ماه آینده به صورت بتا در دسترس مشترکین قرار گیرد. ارائه رایگان GPT-4o همچنین نشان دهنده دستاوردهای OpenAI در کاهش هزینه ها است.
با این حال، به دلیل نگرانی در مورد سوء استفاده، عملکرد صوتی در حال حاضر برای همه کاربران API در دسترس نخواهد بود و ابتدا در چند هفته آینده برای برخی از شرکای قابل اعتماد در دسترس خواهد بود.
GPT چتنسخه رایانه شخصی این برنامه اکنون در دسترس است
در حالی که GPT-4o عملکردهای صوتی و تصویری خود را بسیار بهبود بخشیده است، OpenAI همچنین بهروزرسانی نسخه وب ChatGPT UI را اعلام کرد و ادعا کرد که رابط اصلی مکالمهای و ارائه پیام بیشتر دارد. مولاتی تاکید کرد که با وجود مدلهای پیچیدهتر، او امیدوار است که تجربه تعاملی بین کاربران و هوش مصنوعی سادهتر، واضحتر، آسانتر و طبیعیتر باشد تا کاربران نگران رابط کاربری نباشند، بلکه بر روی همکاری با ChatGPT تمرکز کنند.
OpenAI همچنین یک نسخه کامپیوتری از برنامه ChatGPT را اعلام کرد که انتظار می رود ابتدا نسخه MacOS و نسخه ویندوز اواخر امسال راه اندازی شود. شایان ذکر است که قبلاً شایعاتی مبنی بر پایان یافتن مذاکرات بین OpenAI و Apple در مورد همکاری فناوری هوش مصنوعی وجود داشت.
اگر OpenAI را در سرزمین اصلی چین ثبت کنید، اعلان "OpenAI's services are not available in your country."▼

از آنجایی که برای استفاده از ویژگیهای پیشرفته، کاربران باید به ChatGPT Plus ارتقا دهند،در کشورهایی که از OpenAI پشتیبانی نمی کنند، باز کردن ChatGPT Plus بسیار دشوار است و باید با مسائل پیچیده ای مانند کارت های اعتباری مجازی خارجی ...
در اینجا یک وب سایت بسیار مقرون به صرفه را به شما معرفی می کنیم که اکانت اجاره اشتراکی ChatGPT Plus را ارائه می دهد.
لطفاً برای ثبت نام در Galaxy Video Bureau روی آدرس لینک زیر کلیک کنید
روی پیوند زیر کلیک کنید تا راهنمای ثبت نام Galaxy Video Bureau را با جزئیات ▼ مشاهده کنید
نکات:
- آدرس های IP در روسیه، چین، هنگ کنگ و ماکائو نمی توانند برای حساب OpenAI ثبت نام کنند. توصیه می شود با آدرس IP دیگری ثبت نام کنید.
وبلاگ امید چن ویلیانگ ( https://www.chenweiliang.com/ ) "OpenAI ChatGPT-4o: یک مدل هوش مصنوعی همه جانبه که از GPT-4 پیشی می گیرد و یک تجربه تعاملی واقع گرایانه را ارائه می دهد" را به اشتراک گذاشت که ممکن است برای شما مفید باشد.
به اشتراک گذاری لینک این مقاله خوش آمدید:https://www.chenweiliang.com/cwl-31713.html
برای کشف ترفندهای مخفی بیشتر🔑، به کانال تلگرام ما بپیوندید!
اگر دوست داشتید به اشتراک بگذارید و لایک کنید! اشتراک گذاری ها و لایک های شما انگیزه ادامه دار ماست!
