یادم اومد قبلا یک
مقاله با این روند که OpenAI الان معرفی کرده، معرفی کردم که بی ارتباط نیست و هدف این
مقاله که به تازگی منتشر شده قبل از اینکه جواب منو بدی فکر کن به پاسخی که قراره بدی توضیحی کلی راجب روند این مدل جدید:
اOpenAI توکن های استدلالی را برای «فکر کردن» قبل از پاسخ معرفی کرد. این توکن ها دستور را شکسته و چندین رویکرد را در نظر می گیرند.
🔄 فرآیند:
1. توکن های استدلالی تولید کنید
2. نشانه های تکمیل قابل مشاهده را به عنوان پاسخ تولید کنید
3. نشانههای استدلالی را از زمینه حذف کنید
🗑️ دور انداختن نشانههای استدلال، زمینه را بر روی اطلاعات ضروری متمرکز میکند
📊 جریان مکالمه چند مرحله ای:
- توکن های ورودی و خروجی بین چرخش ها منتقل می شوند
- نشانه های استدلال پس از هر نوبت دور انداخته می شوند
🪟 پنجره زمینه: 128 هزار توکن
🔍نمایش بصری:
- نوبت 1: ورودی → استدلال → خروجی
- نوبت 2: خروجی قبلی + ورودی جدید → استدلال → خروجی
- نوبت 3: ورودی های تجمعی → استدلال → خروجی (ممکن است کوتاه شده باشد)
#ایده_جذاب #مقاله 🔸 مطالب بیشتر
👇👇✅ @AI_DeepMind🔸 @AI_Person