TdSV Challenge 2024

Channel
Logo of the Telegram channel TdSV Challenge 2024
@tdsvc_2024Promote
32
subscribers
کانال اطلاع‌رسانی چالش تصدیق هویت گوینده وابسته به متن در سری مسابقات مهما ۱۴۰۳ گروه بحث چالش - @tdsvc_2024_chat
#اطلاع‌رسانی

📣 با سلام و احترام

همان‌طور که از تصویر مشخص است یک فاز «ارسال گزارش چالش» به صفحه مسابقه اضافه شده است. تیم‌های اول تا پنجم لازم است که گزارش روش خود را به طور کامل آماده و در قسمت مربوط به این فاز از مسابقه در پنل کاربری سایت آپلود کنند.

به ددلاین ارسال گزارش دقت کنید که تا چهارشنبه ۳۰ آبان فرصت دارید. از آنجایی که نیاز است تیم ارزیابی تمامی گزارش‌ها را به دقت خوانده و امتیازدهی کنند، امکان تمدید این فاز وجود ندارد و تیم‌هایی که گزارش ارسال نکنند به معنی انصراف از ارزیابی نهایی خواهد بود.

🆔 @tdsvc_2024
#اطلاع‌رسانی

📣 با سلام و احترام

ضمن عرض خسته نباشید به تیم‌های شرکت کننده در چالش «تصدیق هویت گوینده وابسته به متن» به اطلاع می‌رساند که بر اساس نتایج ۵ تیم اول باید گزارش روش ارسالی خود را تا ۳۰ آبان در سایت چالش بارگذاری کنند. این تیم‌ها در نهایت در یک ارائه حضوری در رویداد نهایی در ۷ آذر روش خود را به تیم داوری ارائه کرده تا در نهایت بر اساس نتایج ترکیبی بین نتایج کمی مسابقه و کیفی ۳ تیم منتخب از بین این ۵ تیم انتخاب شوند.

گزارش ارسالی حدود ۴ الی ۵ صفحه کفایت می‌کند و باید شامل توضیحات کاملی از روش ارائه شده و نتایج بخش‌های مختلف جهت بهبود و رسیدن به نتایج نهایی باشد. در صورت عدم ارسال گزارش تیم مربوطه از ارزیابی نهایی کنار گذاشته خواهد شد.

🆔 @tdsvc_2024
Forwarded from AAIC
#نتایج

📣 با سلام و وقت بخیر

چالش «تصدیق هویت گوینده وابسته به متن» امروز یک‌شنبه ۱۳ آبان خاتمه یافت و نتایج کمی تیم‌های شرکت کننده مشخص شد. در این چالش ۱۰ تیم موفق شدند حداقل یک نتیجه ارسال کنند ولی نتایج ۲ تیم آخر غیر معتبر است. از این رو در مجموع ۸ تیم با موفقیت در این چالش شرکت کردند.

رتبه‌بندی تیم‌ها بر اساس نتایج کمی و همچنین امتیازهای کیفی آنها صورت خواهد گرفت. از این رو ۵ تیم اول لازم است که گزارش کاملی از توضیحات روش خود آماده کنند. همچین این ۵ تیم در رویداد نهایی روش خود را به داوران چالش ارائه خواهند کرد و در نهایت مجموع امتیازهای مختلف رتبه نهایی تیم‌ها و جوایز آنها را مشخص خواهد کرد.

🆔 @aaic_aut
#اطلاع‌رسانی

📣 با سلام و احترام

امتیازدهی در سایت به حالت عادی برگشته و چند دقیقه بعد از ارسال نتایج داوری می‌شوند. تا ساعت ۳:۳۰ صبح فردا به وقت ایران فرصت دارید تا نتایج آخر خود جهت داوری را ارسال کنید. تعداد ارسال روزانه نیز به ۳ عدد افزایش داده شده است.

🆔 @tdsvc_2024
#اطلاع‌رسانی

📣 با سلام و احترام

با توجه به تاخیر زیاد در امتیازدهی ارسال‌ها در سایت Codabench که به دلیل شلوغی چالش‌های مختلف ایجاد شده است فعلاً ۲۴ ساعت این چالش تمدید می‌شود تا تیم‌ها بتوانند ارسال‌های آخر خود را ارزیابی کنند. در صورت تداوم ایراد سایت، شنبه شب مجدد تصمیم‌گیری خواهد شد.

🆔 @tdsvc_2024
📣 با سلام و احترام

آخرین نتایج مسابقه تا این لحظه در این تصویر قابل مشاهده است. برای روزهای آینده تا پایان روز جمعه که ددلاین مسابقه است، تیم‌ها دیگر نمی‌توانند لیدربورد را مشاهده کنند و صرفاً‌ نتایج ارسال‌های خود را می‌توانند ببینند. وارد مرحله حساس چالش شده‌ایم. رقابت برای جوایز ارزنده این چالش در ۵ روز آینده به اتمام خواهد رسید.

🆔 @tdsvc_2024
📣 با سلام و احترام

به اطلاع می‌رساند که مسابقه تصدیق هویت گوینده وابسته به متن تا پایان روز جمعه ۱۱ آبان تمدید شد. این آخرین زمان مسابقه است و تحت هیچ شرایطی مجدد تمدید نخواهد شد. پس به این موضوع دقت کنید.

همچنین تعداد ارسال‌های فاز مسابقه به ۱۵ عدد افزایش پیدا کرد تا تیم‌ها بتوانند برای روزهای تمدید شده نیز ارسال‌های خود را به صورت مرتب انجام دهند.

آخرین نتایج این مسابقه در تصویر ارسالی قابل مشاهده است. در نهایت بر اساس نتایج، تعدادی از تیم‌ها برای ارائه حضوری دعوت خواهند شد تا در نهایت بر اساس رای داوران و نتایج کسب شده تیم‌های برتر انتخاب شوند.

🆔 @tdsvc_2024
📣 با سلام و احترام

به اطلاع می‌رساند با توجه به اینکه کارت‌های گرافیک قول داده شده مقداری دیر آماده شدند زمان‌بندی مسابقه چند روزی تمدید خواهد شد ولی هنوز نهایی نشده است. رقابت جذابی بین ۶ تیم اول ایجاد شده است و انشاالله در چند روز آینده نتایج به مراتب بهتری تیم‌ها کسب کنند.

🆔 @tdsvc_2024
#اطلاع‌رسانی

آخرین نتایج تیم‌های شرکت کننده در چالش تشخیص هویت گوینده.

بر اساس این نتایج با ۵ تیم اول مکاتبه شد تا اطلاعات سرور مجهز به کارت گرافیک ۳۰۹۰ برای آنها ارسال شود. لطفاً‌ ایمیل خود را بررسی و در اسرع وقت پاسخ دهید.

بر اساس محدودیت‌هایی که در تعداد کارت‌های موجود بود امکان ارائه این خدمت به همه تیم‌ها وجود ندارد و به همین خاطر فعلاً تا تیم پنجم مورد مکاتبه قرار گرفته‌اند. در صورت عدم نیاز این تیم‌ها، سراغ تیم‌های بعدی خواهیم رفت!

🆔 @tdsvc_2024
#اطلاع‌رسانی

در این جدول می‌توانید نتایج مسابقه داخلی تاکنون را مشاهده کنید.

۶ تیم با موفقیت حداقل یک ارسال نتیجه داشته‌اند که از این بین نتیجه یک تیم به نظر مشکل دارد و معتبر نیست.

حدود یک ماه دیگر زمان برای ورود به این رقابت جذاب باقی مانده است.

🆔 @tdsvc_2024
#اطلاع‌رسانی

در این جدول می‌توانید آخرین نتایج تیم‌ها در بخش بین‌المللی مسابقه را مشاهده کنید. در پست بعدی نتایج فعلی تیم‌های داخلی ارسال خواهد شد.

🆔 @tdsvc_2024
#سوال

سوال: در سیستم امتیاز دهی بالا صفر یعنی هم کلام هم گوینده درست زیر صفر یعنی یکی غلط؟

پاسخ: به طول کلی رنج امتیازات بستگی به روشی دارد که برای امتیازدهی استفاده می‌کند. تنها چیزی که مستقل از روش مدل‌سازی می‌توان گفت این است که هر چه امتیاز نمونه‌های مثبت بیشتر و نمونه‌های منفی کمتر باشد (فاصله بین اینها بیشتر باشد) عملاً راحت‌تر می‌توان اینها را از هم جدا کرد و بهتر است. معمولاً وقتی نرمال‌سازی امتیاز انجام می‌دهید شرایط فرق می‌کند و امتیازات در یک بازه‌ای نرمال می‌شوند.

در روش LLR بدون نرمال‌سازی رنج امتیازات بین منفی بی‌نهایت تا مثبت بی‌نهایت ممکن است قرار گیرد.
#سوال

سوال: سلام خسته نباشید ، در خصوص این که فایل submission باید چه طور باشه میشه بیشتر توضیح بدید ؟ منظورم اینه که در متن توضیحات اومده که فایل answer.txtیک فایل متنی با یک ستون است. هر خط از این فایل نشاندهنده یک عدد اعشاری برای امتیاز ( LLRیا هر شیوه امتیازدهی دیگر) برای تست مربوطه است . منظور از شیوه امتیاز دهی دیگر چیست .

پاسخ: شما نیاز است که ویدیوهای بخش بازشناسی گوینده را مجدد نگاه کنید. ساده‌ترین روش مدل‌سازی ساخت یک مدل GMM از روی یک مدل UBM است که با گفتار تمامی گویندگان آموزش دیده است. در این حالت معمولاً از درست‌نمایی مدل گوینده به روی درست‌نمایی مدل UBM به عنوان امتیاز استفاده میشه که یکبار اگر از آن log بگیرید میشه LLR.

برای روش‌های دیگر مثل PLDA روش امتیازی متفاوت است. در آنجا نیز مجدد به روشی امتیاز دهی حساب می‌شود که در نهایت به همین LLR می‌رسد.

برای روش فاصله کسینوسی ولی مقداری متفاوت است. در اینجا معمولاً فاصله را با روش‌های مختلف نرمال‌سازی می‌کنند که در نهایت برای تست‌ها مثبت بیشتر به ۱ نزدیک شود و برای تست‌ها منفی به ۰ و یا حتی -۱

روش امتیازدهی مورد استفاده هم خیلی به روش مدل‌سازی شما و رویکرد شما به مسئله برمی‌گردد.
#سوال

سوال: در داکیونت آورده شده که برای مقدار LLR ترکیب دو امتیاز Speaker verification و phrase verfication هست یعنی ما به اجزای هرکدام احتمال مربوطه رو دست بیاریم و جمع بزنیم؟

پاسخ: اگر از یک مدل برای هر دو حالت استفاده می‌کنید؛ یعنی اینکه یک مدل هم گوینده را تصدیق می‌کند و هم جمله بیان شده رو. توی این حالت نیاز به ترکیبی وجود ندارد. اما در صورتی که از دو مدل جداگانه استفاده می‌کنید به روش‌های مختلف می‌توان امتیازات را ترکیب کرد که دو روش سری و موازی از باقی بیشتر استفاده می‌شوند. این بخشی از مسابقه است و خودتان باید روش بهینه برای این مسئله پیدا کنید.
#سوال

سوال: سلام وقت بخیر
با توجه به داکیومت که در مورد trial-type توضیحات لازم برای ۴ مورد داده شد ولی تفاوت Tw و TW ذکر نشده
و مورد دوم اینکه برای dev_trials هیچ تست IW وجود ندارد؟

پاسخ: برای ایجاد تست‌های Target-Wrong دو کار می‌شود انجام داد. یا اینکه از گفتار یکی دیگه از ۱۰ جمله همین گوینده استفاده بشه که این حالت با TW نشان داده شده است. حالت دوم وقتی است که از گفتارهای بدون محدودیت یا Free-Text همین گوینده استفاده بشه که این حالت با Tw نشان داده شده است.

در توضیحات چالش شرح داده شده که تست‌های IW به دلیل اینکه به راحتی قابل تشخیص هستند در این چالش استفاده نشده‌اند.
#سوال

سوال: سلام ، خسته نباشید ، استفاده از ترنسفر لرنینگ و استفاده مدل های خارجی مثل WaveLM مجازه ؟

پاسخ: بله. استفاده از تمامی مدل‌های از پیش آموزش دیده که به صورت عمومی در دسترس هستند مجاز است.
Challenge_License_Agreement_2024_Farsi.docx
44.3 KB
با سلام

با عرض پوزش، به نظر در ایمیل ارسالی لینک توافق‌نامه درست ارسال نشده است.

فایل توافق‌نامه را می‌توانید از این لینک و یا همین فایلی که ارسال شده است تکمیل و برای ایمیل مسابقه ارسال کنید.

موفق باشید
با سلام

به چالش تصدیق هویت گوینده وابسته به متن در سری مسابقات مهما ۱۴۰۳ خوش آمدید.
Channel created
Telegram Center
Telegram Center
Channel