AI DeepMind

#مقاله
Канал
Логотип телеграм канала AI DeepMind
@AI_DeepMindПродвигать
10,15 тыс.
подписчиков
583
фото
157
видео
1,08 тыс.
ссылок
مقالات کاربردی هوش مصنوعی در پایتون، علوم پزشکی، علوم انسانی، علوم اعصاب و... دوره های آموزشی از دانشگاه های بزرگ و موسسات انلاین لینک گروه DeepLearning AI: https://t.center/DeepLearningAIExperts AI Admin: https://t.center/Farzadhhss
Forwarded from AI DeepMind (Farzad 🦅)
عنوان مقاله ش خیلی خوشم اومد : قبل کاری فک کن 😂😜

Unified Policy for Interleaving Language Reasoning with Actions
Training Agents to Unify Language Reasoning & Acting

▪️ Think Before You Act: Unified Policy for Interleaving Language Reasoning with Actions


پ.ن: این مقاله رو به شدت پسندیدم اگه در حیطه captioning این مسائل فعالیت میکنید بشدت توصیه میشه

پ.ن: آپدیت ۲۰۲۴ انتشار مدل o1 از OpenAI که مدلش با دقت فوق العاده ای خوبه.

#مقاله #ایده_جذاب

🔸 مطالب بیشتر 👇👇

@AI_DeepMind
AI DeepMind
یادم اومد قبلا یک مقاله با این روند که OpenAI الان معرفی کرده، معرفی کردم که بی ارتباط نیست و هدف این مقاله که به تازگی منتشر شده قبل از اینکه جواب منو بدی فکر کن به پاسخی که قراره بدی توضیحی کلی راجب روند این مدل جدید:

اOpenAI توکن های استدلالی را برای «فکر کردن» قبل از پاسخ معرفی کرد. این توکن ها دستور را شکسته و چندین رویکرد را در نظر می گیرند.

🔄 فرآیند:
1. توکن های استدلالی تولید کنید
2. نشانه های تکمیل قابل مشاهده را به عنوان پاسخ تولید کنید
3. نشانه‌های استدلالی را از زمینه حذف کنید

🗑️ دور انداختن نشانه‌های استدلال، زمینه را بر روی اطلاعات ضروری متمرکز می‌کند

📊 جریان مکالمه چند مرحله ای:
- توکن های ورودی و خروجی بین چرخش ها منتقل می شوند
- نشانه های استدلال پس از هر نوبت دور انداخته می شوند

🪟 پنجره زمینه: 128 هزار توکن

🔍نمایش بصری:
- نوبت 1: ورودی → استدلال → خروجی
- نوبت 2: خروجی قبلی + ورودی جدید → استدلال → خروجی
- نوبت 3: ورودی های تجمعی → استدلال → خروجی (ممکن است کوتاه شده باشد)

#ایده_جذاب #مقاله

🔸 مطالب بیشتر 👇👇

@AI_DeepMind
🔸 @AI_Person
گوگل مدل DataGemma که شامل مجموعه‌ای از مدل‌های Gemma 2 است که به LLM‌ها کمک می‌کند تا به داده‌های عددی و آماری دسترسی داشته باشند و آن‌ها را ترکیب کنند را معرفی کرد.

به طور خاص، آنها رویکرد جدیدی به نام Retrieval Interleaved Generation (RIG) پیشنهاد می‌کنند که می‌تواند داده‌های آماری عمومی را از Data Commons به طور قابل اعتمادی در پاسخ‌های LLM بگنجاند.

هRIG، یک رویکرد الهام‌گرفته از ابزار، می‌تواند نشانه‌های آماری را با سؤالات زبان طبیعی مناسب برای بازیابی از Data Commons در هم آمیخت. برای دستیابی به چنین قابلیتی، آنها LLM را بر روی یک مجموعه داده دستورالعمل-پاسخ که با کمک Gemini 1.5 تولید شده است، تنظیم می کنند.

رویکرد RIG واقعیت را از 5 تا 7 درصد به حدود 58 درصد بهبود می بخشد.

▪️ Knowing When to Ask -Bridging Large Language Models and Data

#ایده_جذاب #مقاله

🔸 مطالب بیشتر 👇👇

@AI_DeepMind
🔸 @AI_Person
آیا #هوش_مصنوعی با توضیح خودش بهتر یاد می گیرد؟ این #مقاله به چگونگی بهبود تعمیم مدل های هوش مصنوعی و اجتناب از میانبرها را با ارزیابی توضیحات آنها بررسی می کند.

▪️ Learning by Self-Explaining

#ایده_جذاب

🔸 مطالب بیشتر 👇👇

@AI_DeepMind
🔸 @AI_Person
این #هوش_مصنوعی میتونه عکس دوران بچگی و بزرگسالی خودتون رو بدین این امکان رو محیا میکنه ک بتونن همدیگه بغل کنن

https://www.vidu.studio/create

#مقاله

🔸 مطالب بیشتر 👇👇

@AI_DeepMind
🔸 @AI_Person
چیزی که داره اخیرا رشد میکنه و سعی در پاسخ به اون هستن چالش Real-time بودن دیتاست توی این مقاله یک مدل speech-to-speech و متن به صدا معرفی کردن که میتونه یک گوشه جوابی به این چالش باشه.

◾️ Mini-Omni: Language Models Can Hear, Talk While Thinking in Streaming
◾️ Model
◾️ Codebase

#مقاله #ایده_جذاب

🔸 مطالب بیشتر 👇👇

@AI_DeepMind
🔸 @AI_Person
تعدادی مقاله جالب

[1]
SelectLLM: Query-Aware Efficient Selection Algorithm for Large Language Models

[2] Open-FinLLMs: Open Multimodal Large Language Models for Financial Application

[3] LLM Pruning and Distillation in Practice: The Minitron Approach

[4] A Strategy to Combine 1stGen Transformers and Open LLMs for Automatic Text Classification

[5] Flexora: Flexible Low Rank Adaptation for Large Language Models

[6] StructuredRAG: JSON Response Formatting with Large Language Models

#مقاله #ایده_جذاب

🔸 مطالب بیشتر 👇👇

@AI_DeepMind
🔸 @AI_Person
تعدادی مقاله راجب RAG که تازه به دستم رسید😁

[1] Meta Knowledge for Retrieval Augmented Large Language Models

[2] RAGLAB: A Modular and Research-Oriented Unified Framework for Retrieval-Augmented Generation

[3] Graph Retrieval-Augmented Generation: A Survey

[4] CommunityKG-RAG: Leveraging Community Structures in Knowledge Graphs for Advanced Retrieval-Augmented Generation in Fact-Checking

[5] W-RAG: Weakly Supervised Dense Retrieval in RAG for Open-domain Question Answering

#مقاله #ایده_جذاب

🔸 مطالب بیشتر 👇👇

@AI_DeepMind
🔸 @AI_Person
بسیاری از ماها که در #هوش_مصنوعی فعالیت میکنیم و سرعت انتشار مدلهای متن باز هر روز داره بیشتر میشه و میخواییم سهم کوچک خودمون رو برای زبان فارسی انجام بدیم اما با کمبود مدلهای فاین توین شده و ترین کردن طرف بودیم و الان تیمی قوی از دوستانی حرفه ای و کاربلد این کارو انجام دادند اینجا میتونین داستان اینکه چطوری بزرگترین مدل زبان فارسی منتشر شده رو بخونین و از parsbench استفاده کنید.
https://hooshio.com/parsbench-persian-llms/

https://github.com/ParsBench/ParsBench

#مقاله #ایده_جذاب

🔸 مطالب بیشتر 👇👇

@AI_DeepMind
🔸 @AI_Person
یکی از چالش مارکت کمپانی های #هوش_مصنوعی دسترسی به داده های Real time هستش حالا کمپانی Perplexity حرف بالا رو تایید می‌کنه، ویژگی دسترسی به داده‌های real-time اضافه کردند، با شعار مارکتینگ پیش‌بینی آینده! و البته مدل‌های LLM قابلیت پیش‌بینی ندارند برای این دوره ندارند، ابزارهایی هم زود دیپلوی شد، پر از باگ و اشتباه بودند و راهی دراز در پیش هست.

پ.ن: نظر شما چیه ؟

#مقاله #ایده_جذاب #الگوریتمها

🔸 مطالب بیشتر 👇👇

@AI_DeepMind
🔸 @AI_Person
دانشگاه های آمریکایی خیلی دنبال #هوش_مصنوعی در #علوم_پزشکی هستند

آیا LLM ها می توانند نتایج کارآزمایی بالینی را از روی اسناد پروتکل پیش بینی کنند؟

▪️ CTP-LLM: Clinical Trial Phase Transition Prediction Using Large Language Models

#مقاله #ایده_جذاب #الگوریتمها

🔸 مطالب بیشتر 👇👇

@AI_DeepMind
🔸 @AI_Person
در چند پست قبل سوال پژوشگران علوم پزشکی این بود آیا مدلهای LLM میتونن ببینند یا نه ؟ امروز یه سوال جدید پرسیده شده:

آیا VLM ها می توانند مانند یک پاتولوژیست سلول های سرطانی را ببینند؟

▪️ HistAI Presents: A Family of Foundational Vision Transformers for Pathology

#مقاله #ایده_جذاب #الگوریتمها #علوم_پزشکی

🔸 مطالب بیشتر 👇👇

@AI_DeepMind
🔸 @AI_Person
در این سایت میتوانید بصورت لایو، آزمون تورینگ رو اجرا کنید. یعنی شما در این سایت با یک نفر چت می‌کنید. در انتها باید بگید اونی که باهاش چت کردید یک انسان بود یا یک ربات #هوش_مصنوعی.

https://www.humanornot.ai/

#مقاله #ایده_جذاب #الگوریتمها

🔸 مطالب بیشتر 👇👇

@AI_DeepMind
🔸 @AI_Person
Ещё