جهان آمار نوین

Channel
Logo of the Telegram channel جهان آمار نوین
@sumstatisticalPromote
607
subscribers
به نام خدا 🔹 جهان آمار نوین 🔹 🔍 نگرشی نو به دنیای داده🌎 📊 مشاوره آماری 📚 تولید محتوا آموزشی 💻 انجام پروژه‌های آماری 🤔 بیشتر درباره ما بدانید https://t.center/sumstatistical/5 ارتباط با ادمین: @zsafaei2000 @Reza_BGF شروع فعالیت: 1403/03/03
Variable Selection Part 3.pdf
549.9 KB
💻 روش‌های انتخاب متغیر پارت سوم

گرد آورنده: سمیرا بلوچی

#انتخاب_متغیر
#روش_لاسو
#روش_ریج
#روش_الاستیک_نت

📱صفحات اجتماعی جهان آمار نوین :

  ─┅─═ঊঈ* SUM *ঊঈ═─┅─

      تلگرام    اینستاگرام    یوتیوب   لینکدین

    ─┅─═ঊঈ* SUM *ঊঈ═─┅─
جهان آمار نوین
#تحلیل_مولفه_های_مستقل #کشف_الگوهای_پنهان #تحلیل_سیگنال 📱صفحات اجتماعی جهان آمار نوین :   ─┅─═ঊঈ* SUM *ঊঈ═─┅─       تلگرام    اینستاگرام    یوتیوب   لینکدین     ─┅─═ঊঈ* SUM *ঊঈ═─┅─
💢 تحلیل مؤلفه‌های مستقل
(Independent Component Analysis (ICA))


تحلیل مؤلفه‌های مستقل (ICA) یک روش آماری و محاسباتی است، که برای جداسازی سیگنال‌های مخلوط شده به کار می‌رود. این روش به دنبال یافتن مؤلفه‌هایی است که از نظر آماری مستقل از یکدیگر هستند. در ICA، فرض بر این است که داده‌های مشاهده‌شده ترکیبی از منابع مستقل هستند و هدف اصلی یافتن این منابع مستقل (سیگنال‌ها) است.

🌀 کاربردهای ICA🌀

پردازش سیگنال: ICA برای جداسازی سیگنال‌ها، مانند استخراج صدای افراد مختلف در یک محیط شلوغ یا جداسازی سیگنال‌های مغزی به کار می‌رود.
پردازش تصویر: برای شناسایی و استخراج ویژگی‌های مستقل در تصاویر و تحلیل داده‌های تصویری مانند MRI.
تحلیل داده‌های پزشکی: در تحلیل سیگنال‌های قلبی و مغزی (ECG و EEG) برای جداسازی منابع مستقل و تشخیص الگوهای پنهان استفاده می‌شود.
اقتصاد و مالی: برای شناسایی عوامل پنهان و مستقل در داده‌های مالی و اقتصادی که تأثیرگذار بر شاخص‌های اقتصادی هستند.

🌀 مثالی از ICA🌀

فرض کنید که در یک مهمانی شلوغ چندین نفر به طور هم‌زمان صحبت می‌کنند و ما چند میکروفون داریم که ترکیب صدای همه افراد را ضبط می‌کند. هدف این است که با استفاده از ICA، صدای هر شخص را به طور جداگانه از این مخلوط استخراج کنیم. هر صدای فرد به عنوان یک سیگنال مستقل از دیگران در نظر گرفته می‌شود و ICA به ما کمک می‌کند تا این سیگنال‌های مستقل را از هم تفکیک کنیم.

🌀 فرضیات ICA 🌀

استقلال آماری: یکی از مهم‌ترین فرضیات ICA این است که منابع سیگنال‌ها به صورت آماری مستقل از یکدیگر هستند. به عبارت دیگر، داده‌هایی که می‌خواهیم از هم جدا کنیم نباید هیچ وابستگی آماری داشته باشند. اگر این فرض نقض شود، ICA نمی‌تواند به درستی سیگنال‌ها را جدا کند.

غیرگوسی بودن (Non-Gaussianity): منابع مستقل دارای توزیع‌های غیرگوسی هستند. این فرضیه برای جداسازی مهم است، زیرا بر اساس قضیه مرکزی حد، مخلوطی از سیگنال‌های مستقل به توزیع نرمال تمایل دارد. معیارهایی مانند "Kurtosis" یا "Negentropy" برای تشخیص غیرگوسی بودن استفاده می‌شوند.

ترکیب خطی: سیگنال‌های مشاهده‌شده ترکیب‌های خطی از منابع مستقل هستند. این ترکیب از طریق ضرایب خطی اعمال می‌شود.
تعداد منابع کمتر یا مساوی با تعداد سیگنال‌های مشاهده‌شده: این شرط برای امکان‌پذیر بودن جداسازی ضروری است.

🟩مزایای ICA

استقلال واقعی سیگنال‌ها: ICA می‌تواند سیگنال‌های مستقل را حتی در محیط‌هایی با نویز زیاد یا پیچیدگی بالا به خوبی جدا کند.
کاربردهای متنوع: از پردازش سیگنال و تصویر تا تحلیل داده‌های اقتصادی و پزشکی استفاده می‌شود.
کشف الگوهای پنهان: به دلیل تمرکز بر یافتن منابع مستقل، الگوهای پیچیده‌ای را کشف می‌کند که با روش‌های دیگر مانند PCA قابل شناسایی نیستند.

🟥 معایب ICA

پیچیدگی محاسباتی و فرضیات محدودکننده: اجرای ICA به محاسبات پیچیده نیاز دارد و فرضیات مشخصی مانند استقلال آماری و غیرگوسی بودن را مطرح می‌کند.
حساسیت به نویز و شرایط اولیه: هرچند ICA قادر به جداسازی سیگنال‌هاست، اما در صورت وجود نویز بسیار قوی یا وابستگی آماری بین منابع، عملکرد آن کاهش می‌یابد.
نیاز به تعداد کافی مشاهدات: برای تخمین دقیق مؤلفه‌های مستقل به داده‌های کافی نیاز است.

🔆 تفاوت ICA با PCA (تحلیل مؤلفه‌های اصلی):
هرچند هر دو روش در تحلیل داده‌های چندمتغیره استفاده می‌شوند، اما تفاوت‌های اساسی دارند:

روش PCA برای کاهش ابعاد داده‌ها و شناسایی جهت‌هایی با بیشترین واریانس استفاده می‌شود و به استقلال آماری توجهی ندارد.
روش ICA برای جداسازی مؤلفه‌های مستقل در داده‌های مخلوط طراحی شده است و می‌تواند جهت‌های دارای استقلال آماری را شناسایی کند.

نتیجه‌گیری: ICA یک روش قدرتمند برای جداسازی و شناسایی منابع مستقل است و کاربردهای گسترده‌ای در زمینه‌های مختلف دارد. با این حال، برای استفاده موثر از آن، باید به پیچیدگی‌ها و محدودیت‌های روش توجه شود.


#تحلیل_مولفه_های_مستقل
#کشف_الگوهای_پنهان
#تحلیل_سیگنال



📱صفحات اجتماعی جهان آمار نوین :

  ─┅─═ঊঈ* SUM *ঊঈ═─┅─

      تلگرام    اینستاگرام    یوتیوب   لینکدین

    ─┅─═ঊঈ* SUM *ঊঈ═─┅─
#تحلیل_مولفه_های_مستقل
#کشف_الگوهای_پنهان
#تحلیل_سیگنال



📱صفحات اجتماعی جهان آمار نوین :

  ─┅─═ঊঈ* SUM *ঊঈ═─┅─

      تلگرام    اینستاگرام    یوتیوب   لینکدین

    ─┅─═ঊঈ* SUM *ঊঈ═─┅─
Outlier
Sahar Moosavi
🎙 سحر موسوی
📊 داده دور افتاده


#پادکست_آموزشی
#داده_دور_افتاده


📱صفحات اجتماعی جهان آمار نوین :

  ─┅─═ঊঈ* SUM *ঊঈ═─┅─

      تلگرام    اینستاگرام    یوتیوب   لینکدین

    ─┅─═ঊঈ* SUM *ঊঈ═─┅─
📍انجمن علمی ریاضی دانشگاه شهید بهشتی با همکاری انجمن علمی آمار دانشگاه شهید بهشتی برگزار میکند:

💥دوره‌ی جمع‌بندی ریاضیات عمومی کنکور ارشد💥

🔹با تدریس محمد حسین عباسی بنیاد🔹
❗️رتبه ۱۰ کنکور ارشد ریاضی
❗️دانشجوی ارشد علم داده ها دانشگاه شهید بهشتی

🗓شروع دوره: ۱ آذر

🗓مهلت ثبت نام: ۳۰ آبان

این دوره ۱۶ جلسه‌ای به صورت هفتگی در روزهای پنجشنبه و جمعه برگزار میشود.

سر فصل های دوره:
🔻حد و پیوستگی
🔻مشتق و کاربرد
🔻انتگرال و کاربرد
🔻مختصات قطبی
🔻اعداد مختلط
🔻دنباله و سری
🔻توابع برداری
🔻توابع چند متغیره
🔻انتگرال چندگانه
🔻انتگرال خط و سطح


⁉️برای دریافت اطلاعات بیشتر و ثبت نام به اکانت زیر پیام بدید:
--->@Sbumathassociation<---


🆔@MathSBU | انجمن علمی ریاضی دانشگاه شهید بهشتی

🆔@StatisticsSBU2 | انجمن علمی آمار دانشگاه شهید بهشتی
Functional Data .pdf
1.3 MB
💻 داده‌های تابعی

گرد آورنده: زهرا صفایی عارف

#داده_های_تابعی
#تحلیل_الگو
#منحنی_پیوسته



📱صفحات اجتماعی جهان آمار نوین :

  ─┅─═ঊঈ* SUM *ঊঈ═─┅─

      تلگرام    اینستاگرام    یوتیوب   لینکدین

    ─┅─═ঊঈ* SUM *ঊঈ═─┅─
جهان آمار نوین
📱صفحات اجتماعی جهان آمار نوین :   ─┅─═ঊঈ* SUM *ঊঈ═─┅─       تلگرام    اینستاگرام    یوتیوب   لینکدین     ─┅─═ঊঈ* SUM *ঊঈ═─┅─
📊 درخت تصمیم (Decision Tree) و کاربرد آن در تحلیل داده‌ها

درخت تصمیم یکی از محبوب‌ترین و قابل فهم‌ترین الگوریتم‌های یادگیری ماشین است که برای تحلیل و پیش‌بینی داده‌ها در مسائل طبقه‌بندی و رگرسیون استفاده می‌شود. این روش با ایجاد یک نمودار ساختاری از گره‌های تصمیم (Decision Nodes) و برگ‌ها (Leaves)، امکان تفسیر و تجزیه و تحلیل تصمیم‌های پیچیده را به شکل بصری فراهم می‌کند. در هر گره، داده‌ها بر اساس ویژگی‌های خاصی به دسته‌های مختلف تقسیم می‌شوند و برگ‌ها نتایج نهایی یا دسته‌بندی‌ها را نشان می‌دهند. این فرآیند شبیه به پرسیدن سوالات متوالی است که در نهایت به یک نتیجه منجر می‌شود. به عنوان مثال، درخت تصمیمی برای انتخاب یک خودرو ممکن است با سوالاتی مانند «بودجه چقدر است؟» یا «سوخت خودرو چیست؟» آغاز شود. درخت تصمیم به‌ویژه در زمینه‌هایی مانند کسب‌وکار، پزشکی، و بازاریابی کاربرد فراوانی دارد، چرا که به تحلیل داده‌ها و پیش‌بینی نتایج در شرایط عدم قطعیت(Uncertainty ) کمک شایانی می‌کند.

📈 ساختار درخت تصمیم

درخت تصمیم از اجزای زیر تشکیل شده است:

گره ریشه (Root Node): نقطه شروع درخت که شامل کل مجموعه داده است.
گره‌های داخلی (Internal Nodes): نقاطی که داده‌ها در آن‌ها بر اساس ویژگی‌های خاص تقسیم می‌شوند و به شاخه‌های مختلف هدایت می‌گردند.
برگ (Leaf): نقطه نهایی هر شاخه در درخت که نتیجه یا دسته‌بندی نهایی را نمایش می‌دهد و نشان‌دهنده‌ی پایان مسیر تصمیم‌گیری است.

🌀🌀 مراحل ایجاد درخت تصمیم 🌀🌀

انتخاب ویژگی اصلی: ابتدا باید ویژگی کلیدی که بیشترین تفاوت را بین داده‌ها ایجاد می‌کند، انتخاب شود.
تقسیم داده‌ها بر اساس ویژگی: داده‌ها بر اساس مقادیر مختلف ویژگی انتخاب‌شده، به شاخه‌های جداگانه تقسیم می‌شوند.
تکرار مراحل تقسیم: این فرآیند برای گره‌های دیگر نیز ادامه پیدا می‌کند تا زمانی که تمامی داده‌ها به دسته‌های مشخصی تقسیم شوند.
رسیدن به گره‌های نهایی: هنگامی که تقسیم داده‌ها به نتیجه نهایی رسید، درخت تکمیل شده و برگ‌ها نشان‌دهنده نتایج یا دسته‌های نهایی هستند.

🌀🌀 شاخص‌های مهم در درخت تصمیم 🌀🌀

درخت تصمیم از شاخص‌هایی مانند آنتروپی (Entropy) و اطلاعات کسب‌شده (Information Gain) برای انتخاب بهترین گره استفاده می‌کند:

آنتروپی: معیار عدم اطمینان یا تصادفی بودن داده‌ها را اندازه‌گیری می‌کند.
اطلاعات کسب‌شده: نشان‌دهنده‌ی میزان کاهش ابهام پس از تقسیم داده‌ها است.

🌀🌀 مزایا و محدودیت‌های درخت تصمیم 🌀🌀

مزایا

قابل تفسیر و فهم برای کاربران غیرتخصصی.
قدرت نمایش تصمیم‌گیری‌های پیچیده به شکل ساده.
مناسب برای داده‌های غیرخطی و پیچیده.

معایب

امکان بیش‌برازش (Overfitting) که دقت مدل را کاهش می‌دهد.
حساسیت به داده‌های نویزی و کوچک بودن حجم نمونه.

📊 مثال کاربردی: پیش‌بینی ترک شغل کارکنان در یک شرکت فناوری

فرض کنید شما مدیر منابع انسانی یک شرکت فناوری هستید و می‌خواهید پیش‌بینی کنید کدام یک از کارکنان ممکن است در آینده نزدیک شرکت را ترک کنند. برای این منظور، اطلاعاتی مانند سابقه کار، میزان رضایت شغلی، تعداد پروژه‌های انجام‌شده، و ساعات کاری هفتگی را در اختیار دارید.

با استفاده از درخت تصمیم، مراحل زیر را طی می‌کنید:

جمع‌آوری داده‌ها: اطلاعات مربوط به کارکنان فعلی و سابق را جمع‌آوری می‌کنید.
انتخاب ویژگی‌ها: ویژگی‌هایی مانند «میزان رضایت شغلی» و «ساعات کاری هفتگی» را به‌عنوان معیارهای اصلی انتخاب می‌کنید.
ساخت درخت تصمیم: بر اساس داده‌های موجود، درخت تصمیمی ایجاد می‌کنید که نشان می‌دهد کدام ترکیب از ویژگی‌ها منجر به ترک شغل می‌شود.
پیش‌بینی: با استفاده از درخت تصمیم، کارکنانی که در معرض خطر ترک شغل هستند را شناسایی کرده و اقدامات پیشگیرانه انجام می‌دهید.

#درخت_تصمیم
#تحلیل_داده
#یادگیری_ماشین
#تصمیم_گیری


📱صفحات اجتماعی جهان آمار نوین :

  ─┅─═ঊঈ* SUM *ঊঈ═─┅─

      تلگرام    اینستاگرام    یوتیوب   لینکدین

    ─┅─═ঊঈ* SUM *ঊঈ═─┅─
📱صفحات اجتماعی جهان آمار نوین :

  ─┅─═ঊঈ* SUM *ঊঈ═─┅─

      تلگرام    اینستاگرام    یوتیوب   لینکدین

    ─┅─═ঊঈ* SUM *ঊঈ═─┅─
جهان آمار نوین
#ضریب_همبستگی_کانونی #تحلیل_چند_متغیره #اقتصاد #تحقیقات_بازار 📱صفحات اجتماعی جهان آمار نوین :   ─┅─═ঊঈ* SUM *ঊঈ═─┅─       تلگرام    اینستاگرام    یوتیوب   لینکدین     ─┅─═ঊঈ* SUM *ঊঈ═─┅─
💢 تحلیل همبستگی کانونی (Canonical Correlation Analysis)

تحلیل همبستگی کانونی یک روش آماری قدرتمند است که به ما کمک می‌کند رابطه بین دو مجموعه متغیر را به‌طور همزمان بررسی کنیم. این روش زمانی به کار می‌آید که بخواهیم بدانیم آیا دو گروه از متغیرها با هم مرتبط هستند یا نه؛ یعنی به‌جای اینکه تک‌تک متغیرها را بررسی کنیم، یک نگاه کلی و جامع به رابطه بین دو مجموعه از متغیرها داشته باشیم.

📚 مثال‌ها

📉مثال اول

فرض کنید می‌خواهید رابطه بین تحصیلات و ساعت‌های مطالعه (به عنوان یک مجموعه) با درآمد و رضایت شغلی (به عنوان مجموعه دیگر) را بررسی کنید. همبستگی کانونی این امکان را به ما می‌دهد که یک ارتباط همزمان بین این دو مجموعه پیدا کنیم. مثلاً، شاید متوجه شویم افرادی که تحصیلات بالاتری دارند و بیشتر مطالعه می‌کنند، معمولاً درآمد بالاتری هم دارند و از شغل‌شان راضی‌ترند.

📈مثال دوم

حالا فرض کنید مدیر یک شرکت هستید و می‌خواهید بدانید آیا مجموعه‌ای از مهارت‌های کارکنان (مثل مهارت‌های فنی و ارتباطی) با موفقیت شغلی‌شان (مثل ارتقاء و رضایت شغلی) مرتبط است یا نه. همبستگی کانونی به ما کمک می‌کند ببینیم آیا افرادی که مهارت‌های بالاتری دارند، موفقیت شغلی بیشتری هم به دست می‌آورند.

📉مثال سوم

فرض کنید می‌خواهید بدانید آیا عادت‌های ورزشی و تغذیه‌ای افراد (مثل میزان ورزش و نوع رژیم غذایی) با سلامتی و انرژی روزانه آن‌ها ارتباط دارد یا نه. همبستگی کانونی بررسی می‌کند که آیا کسانی که بیشتر ورزش می‌کنند و رژیم غذایی بهتری دارند، سلامت و انرژی بیشتری هم دارند یا نه.

📊 کاربردهای تحلیل همبستگی کانونی

این روش در زمینه‌های مختلفی مثل اقتصاد، روانشناسی، علوم اجتماعی و بازاریابی کاربرد دارد. هر جایی که محققان با مجموعه‌های متغیرهای مرتبط سروکار دارند، این روش می‌تواند برای بررسی رابطه کلی بین این مجموعه‌ها خیلی مفید باشد.

مزایای تحلیل همبستگی کانونی

بررسی چند متغیر به‌صورت همزمان: به‌جای اینکه تک‌تک روابط را بررسی کنیم، با تحلیل همبستگی کانونی می‌توانیم تصویر کلی و همزمانی از دو مجموعه متغیرها به دست بیاوریم.
دید بهتر از روابط پیچیده: این روش به ما کمک می‌کند تا به‌طور دقیق‌تر روابط پیچیده بین مجموعه‌های مختلف رو درک کنیم.
کاربرد گسترده در تحقیقات بین‌رشته‌ای: تحلیل همبستگی کانونی به‌ویژه در مطالعات چندرشته‌ای خیلی کاربردی‌تر است، چرا که می‌تواند همبستگی‌های گسترده رو به‌خوبی بررسی کند.

معایب تحلیل همبستگی کانونی

نیاز به نمونه‌های زیاد: برای اینکه نتایج قابل اعتمادی به دست بیاید، این تحلیل به نمونه‌های زیادی نیاز دارد.
حساسیت به خطی بودن روابط: همبستگی کانونی فرض می‌کند که رابطه بین متغیرها خطی است. اگه رابطه‌ها غیرخطی باشد، ممکن است نتيجه دقیق نباشد.
تفسیر پیچیده: تفسیر نتایج این روش کمی تخصصی و پیچیده‌ است و نیاز به دانش آماری دارد.

#ضریب_همبستگی_کانونی
#تحلیل_چند_متغیره
#اقتصاد
#تحقیقات_بازار


📱صفحات اجتماعی جهان آمار نوین :

  ─┅─═ঊঈ* SUM *ঊঈ═─┅─

      تلگرام    اینستاگرام    یوتیوب   لینکدین

    ─┅─═ঊঈ* SUM *ঊঈ═─┅─
#ضریب_همبستگی_کانونی
#تحلیل_چند_متغیره
#اقتصاد
#تحقیقات_بازار


📱صفحات اجتماعی جهان آمار نوین :

  ─┅─═ঊঈ* SUM *ঊঈ═─┅─

      تلگرام    اینستاگرام    یوتیوب   لینکدین

    ─┅─═ঊঈ* SUM *ঊঈ═─┅─
جهان آمار نوین
💢کانال مجموعه جهان آمار نوین در یک نگاه 🔸️معرفی مجموعه جهان آمار نوین 🔹️پوستر مجموعه جهان آمار نوین 🔸️فعالیت ‌روزانه یک آماری 🔹️نمونه کار چند متغیره پیوسته 1 🔸️نمونه کار پروژه آمار فضایی 🔹️نمونه کار پروژه چند متغیره پیوسته 2 🔸️نمونه کار پروژه ساخت…
دوستان عزیز، این لیست مجموعه‌ای از  تولید محتواهای آماری و پادکست به زبان ساده و کاملاً کاربردی است که در هر لحظه به آن نیاز داشتید، با چند کلیک می‌توانید به آن‌ها دست یابید.

با اشتراک‌گذاری این محتواها، شما نه تنها در یادگیری خود پیشرفت می‌کنید، بلکه به دیگران هم کمک می‌کنید تا از این منابع مفید بهره‌مند شوند. حمایت شما، بزرگترین انگیزه ما برای ادامه تولید و توسعه محتوای علمی و کاربردی است.
تشکر🌹🙏
💢کانال مجموعه جهان آمار نوین در یک نگاه


🔸️معرفی مجموعه جهان آمار نوین

🔹️پوستر مجموعه جهان آمار نوین

🔸️فعالیت ‌روزانه یک آماری

🔹️نمونه کار چند متغیره پیوسته 1

🔸️نمونه کار پروژه آمار فضایی

🔹️نمونه کار پروژه چند متغیره پیوسته 2

🔸️نمونه کار پروژه ساخت و تحلیل پرسشنامه با نرم افزار AMOS

🔹️نمونه کار تایپ با لاتک

🔸️نمونه کار پروژه شبکه عصبی و درخت تصمیم

🔹️خطای نوع اول و دوم

🔸️تفاوت واریانس و اریبی

🔹️بیش برازش و کم برازش و برازش مناسب

🔸️رگرسیون

🔹️طبقه بندی

🔸️خوشه بندی

🔹️تفاوت خوشه بندی و طبقه بندی

🔸️یادگیری راهنماییده

🔹️معرفی متدولوژی CRISP_DM در داده کاوی

🔸️یادگیری ناراهنماییده

🔹️چهار توزیع آماری

🔸️مفهوم P Value

🔹️روش تحلیل مولفه های اصلی

🔸️آنتروپی

🔹️متغیر مستقل، وابسته و کنترلی

🔸️تفاوت متغیر مستقل، پیشگو و تبیینی

🔹متغیر مداخله‌گر و تعدیل کننده

🔸ضریب تعیین تعدیل یافته و ارزیابی مدل

🔹پیشامدهای ناسازگار و مستقل

🔸بیش برآورد و کم برآورد

🔹پادکست تفاوت خوشه‌بندی و طبقه‌بندی

🔸آزمون نیکویی برازش

🔹مفهوم رگرسیون

🔸 پادکست رگرسیون

🔹آزمون کای اسکوئر

🔸انواع رگرسیون

🔹پادکست طبقه‌بندی

🔸آزمون بررسی نرمال بودن شاپیرو ویلک

🔹فایل کدنویسی و انواع نمودارهای ggplot2

🔸 پادکست توزیع آماری

🔹آزمون کلموگروف اسمیرنوف

🔸تحلیل نمودار پراکنش

🔹پادکست توزیع نرمال

🔸الگوریتم k نزدیکترین همسایه

🔹آزمون های ناپارامتری در پایتون

🔸رگرسیون لوژستیک

🔹روش‌های رده‌بندی LDA  و QDA

🔸الگوریتم متروپولیس هستینگز

🔹پادکست توزیع یکنواخت

🔸 روش اعتبارسنجی متقابل

🔹 محاسبات آماری در_R

🔸  پادکست جامعه و نمونه

🔹  الگوریتم_K_means

🔸روش های انتخاب متغیر

🔹 پادکست پارامتر و متغیر

🔸نمودار راداری(عنکبوتی)

🔹 انواع روش های نمونه گیری

🔸پادکست متغیر های مستقل و وابسته

🔹 چالش‌های الگوریتم_K_means

🔸تُنُک سازی مولفه‌های اصلی

🔹توابع متعامد تجربی_EOF

🔸الگوریتم_بوت_استرپ

🔹 روش  و معیار های انتخاب متغیر

📱صفحات اجتماعی جهان آمار نوین :

  ─┅─═ঊঈ* SUM *ঊঈ═─┅─

      تلگرام    اینستاگرام    یوتیوب   لینکدین

    ─┅─═ঊঈ* SUM *ঊঈ═─┅─
Variable Selection Part2.pdf
714.5 KB
💻 روش‌های انتخاب متغیر پارت دوم

گرد آورنده: سمیرا بلوچی

#انتخاب_متغیر
#روش_اعتبارسنجی_متقابل
#معیار_مالوس_Cp
#معیار_ضریب_تعیین

📱صفحات اجتماعی جهان آمار نوین :

  ─┅─═ঊঈ* SUM *ঊঈ═─┅─

      تلگرام    اینستاگرام    یوتیوب   لینکدین

    ─┅─═ঊঈ* SUM *ঊঈ═─┅─
جهان آمار نوین
#بوت_استرپ #باز_نمونه_گیری #ناپارامتری #برآورد_پارامتر #خود_راه‌انداز 📱صفحات اجتماعی جهان آمار نوین :   ─┅─═ঊঈ* SUM *ঊঈ═─┅─       تلگرام    اینستاگرام    یوتیوب   لینکدین     ─┅─═ঊঈ* SUM *ঊঈ═─┅─
📊 روش بوت‌استرپ (Bootstrap) و نقش آن در تحلیل آماری

روش بوت‌استرپ یک تکنیک قدرتمند در آمار است که به ما کمک می‌کند برآورد دقیقی از پارامترهای آماری داشته باشیم، حتی زمانی که نمونه داده‌ها محدود است. این روش به‌ویژه در مواقعی که فرضیات توزیعی خاصی نمی‌توانیم برای جامعه آماری در نظر بگیریم، بسیار کارآمد است و به ما امکان می‌دهد با بازنمونه‌گیری مکرر، توزیع آماره‌ها را برآورد کنیم.

📈 روش بوت‌استرپ

روش بوت‌استرپ یک تکنیک ناپارامتری است که با استفاده از نمونه اولیه و چندین بازنمونه‌گیری تصادفی با جایگذاری، به ما امکان می‌دهد توزیعی از آماره‌ها را ایجاد کرده و عدم قطعیت برآوردها را تحلیل کنیم. این روش به‌ویژه در مواردی که نمونه‌ها محدود و داده‌ها پیچیده هستند و فرضیات توزیعی خاصی نمی‌توان در نظر گرفت، کاربرد دارد.

🌀🌀 مراحل روش بوت‌استرپ 🌀🌀

انتخاب نمونه اولیه: یک نمونه از داده‌های موجود گرفته می‌شود.
بازنمونه‌گیری با جایگذاری: چندین بار از همین نمونه، نمونه‌گیری با جایگذاری انجام می‌دهیم.
محاسبه آماره مورد نظر: برای هر بازنمونه، آماره‌ای مانند میانگین، واریانس یا انحراف معیار محاسبه می‌شود.
ایجاد توزیع بوت‌استرپ آماره‌ها: با محاسبه آماره‌ها در هر بازنمونه، توزیع جدیدی به‌دست می‌آید که برآوردی از توزیع پارامترهای جامعه ارائه می‌دهد.

🌀🌀 شرایط استفاده از روش بوت‌استرپ 🌀🌀

برای استفاده از روش بوت‌استرپ، داده‌ها باید مستقل و هم‌توزیع باشند، به این معنی که هر مشاهده به صورت مستقل از سایر مشاهدات ثبت شده باشد و از توزیع مشابهی پیروی کند. این شرط‌ها به بوت‌استرپ اجازه می‌دهند با بازنمونه‌گیری از داده‌ها، توزیع پارامترهای جامعه را به‌درستی تخمین بزند. در غیر این صورت، روش‌های خاص دیگری برای داده‌های وابسته مورد نیاز است.

🌀🌀 روش‌های بوت‌استرپ برای داده‌های وابسته 🌀🌀

برای داده‌هایی که دارای وابستگی هستند (مانند داده‌های سری زمانی و مکانی)، می‌توان از روش‌های زیر استفاده کرد:

بوت‌استرپ بلوکی (Block Bootstrap): برای داده‌های سری زمانی یا مکانی، که داده‌ها به بلوک‌های کوچک و پیوسته تقسیم می‌شوند تا وابستگی‌ها حفظ شوند.
بوت‌استرپ باقی‌مانده‌ها (Residual Bootstrap): برای داده‌هایی که با مدل رگرسیونی توصیف می‌شوند. در این روش، پس از برآورد مدل، از باقی‌مانده‌ها برای بازنمونه‌گیری استفاده می‌شود.

🌀🌀 کاربردهای بوت‌استرپ 🌀🌀

تحلیل عدم قطعیت در یادگیری ماشین: برای برآورد خطا و دقت مدل‌ها
تحلیل‌های مالی: برآورد ریسک و بازده در سرمایه‌گذاری
آزمون‌های فرضیه: برای داده‌های کم و یا با توزیع ناشناخته
پزشکی و بیومتریک: تحلیل داده‌های بالینی که معمولاً حجم کوچکی دارند

مزایا

نیازی به فرضیات توزیعی خاص ندارد.
قابل استفاده برای داده‌های کوچک و محدود.
بهبود دقت در برآورد عدم قطعیت.

معایب

زمان‌بر و محاسباتی سنگین، به‌ویژه برای مجموعه داده‌های بزرگ.
ممکن است برای داده‌های وابسته مانند سری زمانی و داده‌های مکانی به‌درستی عمل نکند (نیاز به روش‌های پیشرفته‌تر مانند بوت‌استرپ بلوکی).

📊 مثال کاربردی: تحلیل نظرات کاربران یک پلتفرم استریمینگ

تصور کنید شما تحلیل‌گر داده در یک پلتفرم استریمینگ مانند نتفلیکس هستید و می‌خواهید میزان رضایت کاربران از یک سریال جدید را تخمین بزنید. تنها دسترسی شما به نظرات ۱۵۰۰ کاربر است و به کل جامعه آماری دسترسی ندارید. حالا با روش بوت‌استرپ مراحل زیر را انجام می‌دهید:

از نظرات کاربران نمونه اولیه خود را تشکیل می‌دهید.
از همین نظرات، چندین بار با جایگذاری بازنمونه‌گیری می‌کنید.
میانگین رضایت را برای هر بازنمونه محاسبه کرده و این میانگین‌ها را ذخیره می‌کنید.
با استفاده از میانگین‌های محاسبه‌شده، توزیع رضایت کاربران را تخمین می‌زنید و حدود اطمینان ۹۵٪ را به‌دست می‌آورید.


#بوت_استرپ
#باز_نمونه_گیری
#ناپارامتری
#برآورد_پارامتر
#خود_راه‌انداز


📱صفحات اجتماعی جهان آمار نوین :

  ─┅─═ঊঈ* SUM *ঊঈ═─┅─

      تلگرام    اینستاگرام    یوتیوب   لینکدین

    ─┅─═ঊঈ* SUM *ঊঈ═─┅─
#بوت_استرپ
#باز_نمونه_گیری
#ناپارامتری
#برآورد_پارامتر
#خود_راه‌انداز


📱صفحات اجتماعی جهان آمار نوین :

  ─┅─═ঊঈ* SUM *ঊঈ═─┅─

      تلگرام    اینستاگرام    یوتیوب   لینکدین

    ─┅─═ঊঈ* SUM *ঊঈ═─┅─
جهان آمار نوین
#توابع_متعامد_تجربی #تحلیل_مولفه_های_اصلی 📱صفحات اجتماعی جهان آمار نوین :   ─┅─═ঊঈ* SUM *ঊঈ═─┅─       تلگرام    اینستاگرام    یوتیوب   لینکدین     ─┅─═ঊঈ* SUM *ঊঈ═─┅─
📊 توابع متعامد تجربی (EOF) و مقایسه با تحلیل مؤلفه‌های اصلی (PCA)

توابع متعامد تجربی یا EOF یکی از روش‌های آماری قدرتمند برای شناسایی الگوهای مکانی و زمانی است که به‌طور گسترده در علوم جوی و محیطی استفاده می‌شود. این روش شباهت زیادی با تحلیل مؤلفه‌های اصلی (PCA) دارد، اما تفاوت‌های اساسی در کاربرد و هدف آن‌ها وجود دارد.

📈 توابع متعامد تجربی (EOF)

در روش EOF، هدف این است که بتوان تغییرات گسترده‌ی داده‌ها را با استفاده از تعداد کمی الگوی مکانی و زمانی توصیف کرد. این روش عمدتاً برای تحلیل داده‌های چندمتغیره در بسترهای مکانی و زمانی مناسب است، زیرا متغیرهای زمانی و مکانی را هم‌زمان در محاسبات وارد می‌کند. این ویژگی باعث شده است که EOF یکی از ابزارهای مهم در تحلیل‌های محیطی مانند داده‌های جوی و اقیانوسی باشد.

📉 تحلیل مؤلفه‌های اصلی (PCA)

در روش PCA  کاهش بُعد عمومی‌تر است که داده‌ها را به مؤلفه‌های متعامد تبدیل می‌کند. هر مؤلفه، بخشی از واریانس کل داده‌ها را توضیح می‌دهد، به‌طوری‌که اولین مؤلفه، بیشترین واریانس را در بر می‌گیرد. تفاوت اصلی در این است که PCA برای طیف وسیعی از داده‌های چندبعدی قابل استفاده است، در حالی که EOF بیشتر در تحلیل‌های محیطی کاربرد دارد.

🌀🌀 تفاوت‌ها 🌀🌀

کاربرد: EOF برای داده‌های محیطی و جوی مناسب‌تر است؛ در حالی که PCA در علوم مختلف از جمله علوم اجتماعی و زیستی نیز رایج است.
تجزیه الگوها: EOF به‌طور خاص روی تجزیه الگوهای مکانی و زمانی تمرکز دارد، در حالی که PCA به تفکیک مؤلفه‌ها بر اساس واریانس داده‌ها می‌پردازد.

🌀🌀 کاربردهای تحلیل EOF 🌀🌀

الگوهای جوی و اقلیمی: تحلیل تغییرات بلندمدت اقلیمی، شناسایی پدیده‌های مختلف.
آلودگی هوا: بررسی پراکندگی و تغییرات آلودگی.
تغییرات اقیانوسی: بررسی جریان‌ها و الگوهای بلندمدت در داده‌های اقیانوسی.

مزایا

کاهش ابعاد: امکان ساده‌سازی داده‌ها با استفاده از تعداد کم الگوهای اصلی.
تشخیص الگوهای غالب: شناسایی الگوهای اصلی در داده‌های پیچیده.

معایب

حساسیت به نویز: نیاز به پیش‌پردازش داده‌ها برای کاهش اثرات نویز.
محدودیت تفسیرپذیری: دشواری در تفسیر مؤلفه‌های پیچیده.

📊 مثال عامیانه از تحلیل EOF:

فرض کنید یک سری عکس از آسمان در طول روز و در مکان‌های مختلف دارید. هر کدام از این عکس‌ها تغییراتی در رنگ و شکل ابرها، نور خورشید و سایه‌ها دارند. حالا شما می‌خواهید از این مجموعه بزرگ عکس‌ها، الگوهایی پیدا کنید که توضیح‌دهنده بیشترین تغییرات در وضعیت آسمان باشند.

روش EOF به این صورت کار می‌کند:

شما داده‌های مربوط به عکس‌ها (مثل میزان نور، شدت رنگ‌ها، وضعیت ابرها و غیره) را به یک سیستم ریاضی وارد می‌کنید.
توابع EOF به شما چند الگوی اصلی از این داده‌ها می‌دهد، مثلاً:
الگوی اول: تغییرات نور خورشید در طول روز.
الگوی دوم: تغییرات در شکل و اندازه ابرها.
الگوی سوم: تغییرات ناشی از آب و هوای بارانی یا آفتابی.

در واقع، این روش به ما کمک می‌کند که به جای بررسی تمام جزئیات هر عکس، فقط چند الگوی اصلی را داشته باشید که بیشترین اطلاعات و تغییرات موجود در داده‌ها را توضیح می‌دهند.

#توابع_متعامد_تجربی
#تحلیل_مولفه_های_اصلی

📱صفحات اجتماعی جهان آمار نوین :

  ─┅─═ঊঈ* SUM *ঊঈ═─┅─

      تلگرام    اینستاگرام    یوتیوب   لینکدین

    ─┅─═ঊঈ* SUM *ঊঈ═─┅─
#توابع_متعامد_تجربی
#تحلیل_مولفه_های_اصلی

📱صفحات اجتماعی جهان آمار نوین :

  ─┅─═ঊঈ* SUM *ঊঈ═─┅─

      تلگرام    اینستاگرام    یوتیوب   لینکدین

    ─┅─═ঊঈ* SUM *ঊঈ═─┅─
انجمن علمی آمار برگزار می‌کند 🌱
عنوان کارگاه: شبکه ها و نقشه ها با نرم افزار R
🔸سرفصل:
نقشه های کارتوگرام و کروپلت
نقشه های حبابی
شبکه ها
نمودارهای رابطه و جریان
نمودارهای قوسی
🕰زمان: 17و 18 آبان ساعت ۱۷ الی ۲۰
💰هزینه: برای دانشجویان ولیعصر ۱۵۰سایر دانشجویان سایر دانشگاه‌ها ۲۰۰و سایرین
۲۵۰هزار تومان
📍مکان:در بستر ادوبی کانکت (همراه با ضبط جلسات)
🔸مدرس : دکتر مصطفی طامندی عضو هیئت علمی گروه آمار دانشگاه ولیعصر
🧾همراه با اعطای گواهی معتبر
جهت ثبت نام و کسب اطلاعات بیشتر با شماره ۰۹۹۲۶۲۳۰۳۱۴ (خانم آرمات) برای ثبت نام به
آیدی تلگرامی @Yallda_ar
sparsity.pdf
1.2 MB
💻 تُنُک سازی مولفه های اصلی

گرد آورنده: زهرا صفایی عارف

#کاهش_بعد
#یادگیری_ناراهنماییده
#تحلیل_مولفه_های_اصلی
#تنک_سازی
#گروه_بندی_متغیرها



📱صفحات اجتماعی جهان آمار نوین :

  ─┅─═ঊঈ* SUM *ঊঈ═─┅─

      تلگرام    اینستاگرام    یوتیوب   لینکدین

    ─┅─═ঊঈ* SUM *ঊঈ═─┅─
Telegram Center
Telegram Center
Channel