Web Analytics Made Easy - Statcounter

 در حالی که هوش مصنوعی این روزها به اوج محبوبیت خود می‌رسد، پژوهشگران هشدار داده‌اند که این صنعت ممکن است با کمبود داده‌های آموزشی روبرو شود.

به گزارش ایسنا، داده‌ها به مانند سوختی هستند که سیستم‌های هوش مصنوعی قدرتمند را نیرو می‌دهند و این مشکل می‌تواند رشد مدل‌های هوش مصنوعی، به ویژه مدل‌های زبانی بزرگ را کاهش دهد و حتی ممکن است مسیر انقلاب هوش مصنوعی را تغییر دهد.

بیشتر بخوانید: اخباری که در وبسایت منتشر نمی‌شوند!

اما چرا کمبود بالقوه داده با توجه به میزان موجود در شبکه جهانی وب یک مشکل است و اینکه آیا راهی برای مقابله با این خطر وجود دارد؟

اهمیت داده‌های با کیفیت بالا برای هوش مصنوعی

ما برای آموزش الگوریتم‌های هوش مصنوعی قدرتمند، دقیق و با کیفیت به داده‌های زیادی نیاز داریم. به عنوان مثال، چت‌بات ChatGPT بر روی ۵۷۰ گیگابایت داده متنی یا حدود ۳۰۰ میلیارد کلمه آموزش داده شده است.

به طور مشابه، الگوریتم انتشار پایدار(که پشت بسیاری از برنامه‌های تولید تصویر هوش مصنوعی مانند DALL-E، Lensa و Midjourney قرار دارد) بر روی مجموعه داده LIAON-۵B متشکل از ۵.۸ میلیارد جفت تصویر-متن آموزش داده شده است. اگر الگوریتمی روی مقدار ناکافی داده آموزش داده شود، خروجی‌های نادرست یا با کیفیت پایین تولید می‌کند.

کیفیت داده‌های آموزشی نیز مهم است. دسترسی به داده‌های با کیفیت پایین مانند پست‌های رسانه‌های اجتماعی یا عکس‌های تار آسان است، اما برای آموزش مدل‌های هوش مصنوعی با کارایی بالا کافی نیستند.

متنی که از سکوهای رسانه‌های اجتماعی گرفته می‌شود ممکن است مغرضانه یا تعصب‌آمیز باشد یا ممکن است حاوی اطلاعات نادرست یا محتوای غیرقانونی باشد که می‌تواند توسط مدل هوش مصنوعی تکرار شود.

به عنوان مثال، زمانی که مایکروسافت سعی کرد ربات هوش مصنوعی خود را با استفاده از محتوای توییتر آموزش دهد، دریافت که خروجی‌های نژادپرستانه و زن‌ستیز تولید می‌کند.

به همین دلیل است که توسعه‌دهندگان هوش مصنوعی به دنبال محتوای باکیفیت مانند متن از کتاب‌ها، مقالات آنلاین، مقالات علمی، ویکی‌پدیا و محتوای وب فیلتر شده خاص هستند. مثلا Google Assistant بر روی ۱۱ هزار رمان عاشقانه برگرفته از سایت خودانتشار Smashwords آموزش دیده است تا اطلاعات بیشتری در چنته داشته باشد.

آیا ما داده‌های کافی داریم؟

صنعت هوش مصنوعی، سیستم‌های هوش مصنوعی را بر روی مجموعه داده‌های بزرگ‌تر آموزش می‌دهد، به همین دلیل است که ما اکنون مدل‌هایی با عملکرد بالا مانند ChatGPT یا DALL-E ۳ داریم.

در عین حال، تحقیقات نشان می‌دهد که ذخیره داده‌های آنلاین بسیار کندتر از مجموعه داده‌های مورد استفاده در حال رشد برای آموزش هوش مصنوعی هستند.

در مقاله‌ای که سال گذشته منتشر شد، گروهی از پژوهشگران پیش‌بینی کردند که اگر روند آموزشی فعلی هوش مصنوعی ادامه یابد، قبل از سال ۲۰۲۶ داده‌های متنی با کیفیت بالا تمام خواهد شد.

آنها همچنین تخمین زدند که داده‌های زبانی با کیفیت پایین بین سال‌های ۲۰۳۰ تا ۲۰۵۰ و داده‌های تصویری با کیفیت پایین بین سال‌های ۲۰۳۰ تا ۲۰۶۰ به پایان می‌رسد.

به گفته گروه مشاوره و حسابداری PwC، هوش مصنوعی تا سال ۲۰۳۰ می‌تواند تا ۱۵.۷ تریلیون دلار به اقتصاد جهان کمک کند. اما تمام شدن داده‌های قابل استفاده می‌تواند توسعه آن را آهسته کند.

آیا باید نگران باشیم؟

در حالی که نکات بالا ممکن است برخی از طرفداران هوش مصنوعی را نگران کند، این وضعیت ممکن است آنقدرها هم که به نظر می‌رسد بد نباشد.

ناشناخته‌های زیادی در مورد چگونگی توسعه مدل‌های هوش مصنوعی در آینده و همچنین چند راه برای مقابله با خطر کمبود داده وجود دارد.

یکی از فرصت‌ها برای توسعه‌دهندگان هوش مصنوعی است که الگوریتم‌ها را بهبود ببخشند تا از داده‌هایی که در حال حاضر در اختیار دارند به طور کارآمدتر استفاده کنند.

این احتمال وجود دارد که در سال‌های آینده آنها بتوانند سیستم‌های هوش مصنوعی با عملکرد بالا را با استفاده از داده‌های کمتر و احتمالاً قدرت محاسباتی کمتر آموزش دهند. این همچنین به کاهش ردپای کربن هوش مصنوعی کمک می‌کند.

گزینه دیگر استفاده از هوش مصنوعی برای ایجاد داده‌های مصنوعی برای آموزش سیستم‌هاست. به عبارت دیگر، توسعه‌دهندگان به سادگی می‌توانند داده‌های مورد نیاز خود را تولید کنند که متناسب با مدل هوش مصنوعی خاص آنها باشد.

چندین پروژه در حال حاضر از محتوای مصنوعی استفاده می‌کنند که اغلب از سرویس‌های تولید داده مانند Mostly AI تهیه می‌شود. این امر در آینده رایج‌تر خواهد شد.

توسعه دهندگان همچنین به دنبال محتوایی خارج از فضای آنلاین رایگان هستند، مانند محتوایی که توسط ناشران بزرگ و مخازن آفلاین نگهداری می‌شود. به میلیون‌ها متن منتشر شده قبل از دوران فراگیری اینترنت فکر کنید.

آنهایی که به صورت دیجیتالی درنیامده‌اند و در دسترس قرار بگیرند، می‌توانند منبع جدیدی از داده‌ها را برای پروژه‌های هوش مصنوعی فراهم کنند.

بنیاد News Corp یکی از بزرگترین دارندگان محتوای خبری در جهان اخیراً اعلام کرده است که در حال مذاکره با توسعه‌دهندگان هوش مصنوعی برای قراردادهای محتواست.

چنین معاملاتی شرکت‌های هوش مصنوعی را مجبور می‌کند برای داده‌های آموزشی پول بپردازند، در حالی که تاکنون بیشتر آنها را به صورت رایگان از اینترنت حذف کرده‌اند.

سازندگان محتوا نسبت به استفاده غیرمجاز از محتوای خود برای آموزش مدل‌های هوش مصنوعی اعتراض کرده‌اند و برخی از شرکت‌هایی مانند مایکروسافت، OpenAI و Stability AI شکایت کرده‌اند.

دریافت پاداش برای کار آنها ممکن است به بازگرداندن برخی از عدم تعادل قدرت بین خلاقان و شرکت‌های هوش مصنوعی کمک کند.

کانال عصر ایران در تلگرام

منبع: عصر ایران

کلیدواژه: هوش مصنوعی داده

درخواست حذف خبر:

«خبربان» یک خبرخوان هوشمند و خودکار است و این خبر را به‌طور اتوماتیک از وبسایت www.asriran.com دریافت کرده‌است، لذا منبع این خبر، وبسایت «عصر ایران» بوده و سایت «خبربان» مسئولیتی در قبال محتوای آن ندارد. چنانچه درخواست حذف این خبر را دارید، کد ۳۹۰۷۲۵۱۲ را به همراه موضوع به شماره ۱۰۰۰۱۵۷۰ پیامک فرمایید. لطفاً در صورتی‌که در مورد این خبر، نظر یا سئوالی دارید، با منبع خبر (اینجا) ارتباط برقرار نمایید.

با استناد به ماده ۷۴ قانون تجارت الکترونیک مصوب ۱۳۸۲/۱۰/۱۷ مجلس شورای اسلامی و با عنایت به اینکه سایت «خبربان» مصداق بستر مبادلات الکترونیکی متنی، صوتی و تصویر است، مسئولیت نقض حقوق تصریح شده مولفان در قانون فوق از قبیل تکثیر، اجرا و توزیع و یا هر گونه محتوی خلاف قوانین کشور ایران بر عهده منبع خبر و کاربران است.

خبر بعدی:

کیفیت بخشی مدارس مهم‌تر از توسعه کمی آن‌ است

ایسنا/سیستان و بلوچستان نماینده ولی‌فقیه در سیستان و بلوچستان گفت: دستگاه آموزش و پرورش احیا کننده نسل جدید ما می‌باشد و کاری که خیرین در حوزه تعلیم و تربیت انجام می‌دهند از جهات مختلف ارزشمند است.

آیت‌الله مصطفی محامی شامگاه جمعه در همایش استانی خیرین مدرسه یار ضمن قدردانی از حضور و مشارکت خیرین در برنامه‌ها و فعالیت‌های دستگاه تعلیم و تربیت اظهار کرد: خداوند متعال در قرآن کریم بیان داشته: "وَمَنْ أَحْیَاهَا فَکَأَنَّمَا أَحْیَا النَّاسَ جَمِیعًا" زنده کردن یک انسان همانند حیات بخشیدن به کل جامعه و زنده کردن همه انسان‌هاست و در مقابل آن عنوان می‌کند:" مَنْ قَتَلَ نَفْسًا بِغَیْرِ نَفْسٍ أَوْ فَسَادٍ فِی الْأَرْضِ فَکَأَنَّمَا قَتَلَ النَّاسَ جَمِیعًا" اگر یک نفر را از بین ببرد مانند این است که همه مردم را از بین ببرد.

امام جمعه زاهدان افزود: در تفسیر این آیه شریفه، بزرگان نظرات مختلفی را عنوان کرده‌اند از اینکه یک تشبیه برای بیان عظمت کار بوده و یا با این تعبیر که یک فرد می‌تواند مبدا تولید نسل باشد و لذا احیای یک نفر احیای یک نسل است.

آیت‌الله محامی بیان کرد: در ادبیات قرآنی حیات منحصر به این حیات مادی نیست بلکه عقل، اندیشه و علم اوست و بر این اساس دستگاه آموزش و پرورش و تعلیم و تربیت دستگاه احیا کننده نسل جدید ما می‌باشد لذا کاری که شما در آموزش و پرورش انجام می‌دهید از جهات مختلف ضریب می‌خورد.

وی ادامه داد: بر اساس همین نگاه انجام کار خیر در حوزه آموزش و پرورش نیز دارای ارزش افزوده است به خصوص که این کار در یک استان پهناور همچون سیستان و بلوچستان صورت می‌گیرد چرا که سیستان و بلوچستان دارای ظرفیت‌ها و توانمندی‌های زیادی است و یکی از این ظرفیت‌ها وجود نیروهای با استعداد است که متاسفانه به درستی شکوفا نشده و مورد استفاده قرار نگرفته و نیازمند توجه ویژه‌ است.

 امام جمعه زاهدان تصریح کرد: خیرین باید قدر خود را بدانند و خداوند متعال را برای این نعمت، موهبت و لطفی که شامل حالشان کرده شکرگزاری کنند.

 نماینده ولی فقیه در سیستان و بلوچستان خاطرنشان کرد: این احیا دارای فرایندی است که بخشی در تامین امکانات و سخت‌ افزار و بخشی در تهیه نرم افزار از جمله برنامه، معلم و اساتید است و این دو مجموعه باید با هم هماهنگ و در یک راستا حرکت کنند.

وی عنوان کرد: مهم‌تر از توسعه کمی مدارس کیفیت بخشی به آن‌هاست و در این جهت نیازمند استفاده از نیروهای توانمند و با تجربه هستیم که از جمله کمبودهای ماست و باید در جهت آموزش نیروها برنامه‌ریزی صورت گیرد و باید دقت کنید که مدارس پس از ساخت رها نشوند و در گام بعد باید تلاش کنید تا کیفیت خدمات در مدارس ارتقا پیدا کند.

آیت‌الله محامی بیان کرد: سیستان و بلوچستان یک استان پهناور است و بسیاری از روستاها پراکنده هستند و طبعأ ساخت مدارس در همه این نقاط امکان پذیر نیست و باید در نقاطی با تمرکز جمعیت ساخت مدارس شبانه‌روزی را دنبال کنیم که در این صورت با توجه به حضور دانش آموزان در مدارس فرصت تعلیم و تربیت بیشتر به صورت شبانه روزی وجود دارد.

وی عنوان کرد: دل کودکان مانند یک کاغذ سفید است و موقعیت شکل گیری شخصیت عقلانی، علمی، فرهنگی، اخلاقی و... در همین دوران کودکی است و اگر در این ایام کار به خوبی صورت گیرد این دانش آموز در آینده پا به هر عرصه‌ای که بگذارد راه درست را خواهد رفت و در غیر این صورت چندان فرد موثری نخواهد بود.

انتهای پیام

دیگر خبرها

  • هوش مصنوعی نخستین طلایی ایران در المپیک را پیش‌بینی کرد | پادشاه ایرانی کشتی جهان باز هم طلا می‌گیرد
  • تأمین سلامت افراد مهم‌ترین رکن پیشرفت جامعه‌
  • آشنایی با برترین سازندگان جرثقیل سقفی در جهان
  • حوزه نظارت بر کیفیت آموزش دانشگاهی در قزوین احیا شد
  • ساخت مدارس شبانه روزی در دستور کار
  • ایران رتبه ۱۷ هوش مصنوعی را در جهان دارد
  • تخصیص ۳۰۰ میلیارد ریال برای تکمیل طرح تغذیه مصنوعی بندان
  • مرمت بندهای تغذیه مصنوعی استان از ابتدای سال تاکنون
  • سؤالات امتحانات نهایی با هدف ارزشیابی یادگیری طراحی می‌شود
  • کیفیت بخشی مدارس مهم‌تر از توسعه کمی آن‌ است