شرکت OpenAI هوش مصنوعی جدیدی به نام o1 را معرفی کرده که بهعنوان اولین مدل از سری مدلهای هوش مصنوعی استدلالی شناخته میشود.
این مدل با هدف پاسخگویی به پرسشهای پیچیدهتر و با سرعتی بیشتر از انسان طراحی شده و برای کاربردهای پیشرفتهتر، ازجمله حل مسائل چندمرحلهای و نوشتن کد، بهینه شده است. همراه با o1، نسخهی کوچکتری به نام o1-mini نیز منتشر شده است. جالب است بدانید که این مدل همان هوش مصنوعی Strawberry است که مدتها محل بحث بوده است.
OpenAI در توسعهی o1 به دنبال نزدیکشدن به هوش مصنوعی شبیه به انسان بوده است. این مدل در مقایسه با مدلهای قبلی مانند GPT-4o عملکرد بهتری در نوشتن کد و حل مسائل پیچیده دارد. بااینحال، به دلیل هزینههای بالاتر و سرعت کمتر، این مدل موقتاً بهصورت پیشنمایش در دسترس قرار گرفته تا نشان دهد که هنوز در مراحل اولیهی توسعه قرار دارد.
دسترسی کاربران و هزینهها
کاربران سرویسهای ChatGPT Plus و Team از امروز به هر دو نسخه o1-preview و o1-mini دسترسی خواهند داشت. کاربران سازمانی و آموزشی نیز اوایل هفتهی آینده به این هوش مصنوعی دسترسی پیدا میکنند. OpenAI همچنین قصد دارد نسخه o1-mini را بهزودی بهطور رایگان برای همه کاربران ChatGPT منتشر کند، هرچند هنوز تاریخ دقیقی برای این اقدام اعلام نشده است.
هزینهی استفاده از o1-Preview بسیار زیاد است؛ در API این مدل، هر ۱ میلیون توکن ورودی ۱۵ دلار و هر ۱ میلیون توکن خروجی ۶۰ دلار هزینه دارد. این در حالی است که هزینههای استفاده از GPT-4o بهترتیب ۵ و ۱۵ دلار برای همین میزان توکن است.
o1 با استفاده از الگوریتم بهینهسازی جدید و مجموعه دادهای خاص آموزش دیده است. Jerry Tworek، مسئول تحقیقات OpenAI، توضیح میدهد که این مدل بهجای تقلید از الگوهای دادههای آموزشی، با استفاده از تکنیک یادگیری تقویتی (Reinforcement Learning) آموزش دیده است. این تکنیک به مدل امکان میدهد تا با دریافت پاداشها و مجازاتها، بهطور مستقل مسائل را حل کند و مشابه با نحوهی حل مشکلات توسط انسان، از رویکرد «زنجیرهی تفکر» برای پردازش سؤالات استفاده میکند.
به دلیل این روش جدید آموزش، OpenAI ادعا میکند که o1 دقت بیشتری نسبت به مدلهای قبلی دارد و کمتر دچار «توهم» میشود. بااینحال، مشکل توهمات بهطور کامل حل نشده است. یکی از ویژگیهای بارز این مدل، توانایی زیاد در حل مسائل پیچیدهای همچون برنامهنویسی و ریاضیات است. در آزمون مقدماتی المپیاد ریاضی، o1 موفق شد ۸۳ درصد از مسائل را حل کند؛ درحالیکه GPT-4o تنها ۱۳ درصد از مسائل را بهدرستی پاسخ داد.
در مسابقات برنامهنویسی Codeforces نیز این مدل به صدک ۸۹ شرکتکنندگان دست یافت. OpenAI پیشبینی میکند که در بهروزرسانیهای بعدی، این مدل بهطور مشابه با دانشجویان دکتری در انجام مسائل دشوار رشتههایی مانند فیزیک و شیمی و زیستشناسی عمل کند.
محدودیتها
بااینحال، هوش مصنوعی o1 در برخی زمینهها هنوز به اندازهی GPT-4o توانمند نیست. این مدل در دانش عمومی و توانایی مرور وب یا پردازش فایلها و تصاویر بهدرستی عمل نمیکند. بااینحال، OpenAI بر این باور است که o1 آغازگر نسلی جدید از مدلهای هوش مصنوعی خواهد بود.
مدل o1 با استفاده از روشهای جدید آموزش و تواناییهای فراوان در حل مسائل پیچیده، گامی بزرگ در مسیر توسعهی هوش مصنوعی بهشمار میرود. هرچند این مدل هنوز در مراحل ابتدایی توسعه قرار دارد و محدودیتهایی در زمینههایی مانند دانش عمومی و تواناییهای جانبی دارد، OpenAI با ارائهی این مدل نشان داده که هدف اصلیاش رسیدن به هوش مصنوعی نزدیک به انسان است.