دادههای جهان برای تغذیه هوش مصنوعی در حال اتمام است
تاریخ انتشار: ۲۱ آبان ۱۴۰۲ | کد خبر: ۳۹۰۷۲۵۱۲
در حالی که هوش مصنوعی این روزها به اوج محبوبیت خود میرسد، پژوهشگران هشدار دادهاند که این صنعت ممکن است با کمبود دادههای آموزشی روبرو شود.
به گزارش ایسنا، دادهها به مانند سوختی هستند که سیستمهای هوش مصنوعی قدرتمند را نیرو میدهند و این مشکل میتواند رشد مدلهای هوش مصنوعی، به ویژه مدلهای زبانی بزرگ را کاهش دهد و حتی ممکن است مسیر انقلاب هوش مصنوعی را تغییر دهد.
بیشتر بخوانید:
اخباری که در وبسایت منتشر نمیشوند!
اما چرا کمبود بالقوه داده با توجه به میزان موجود در شبکه جهانی وب یک مشکل است و اینکه آیا راهی برای مقابله با این خطر وجود دارد؟
اهمیت دادههای با کیفیت بالا برای هوش مصنوعیما برای آموزش الگوریتمهای هوش مصنوعی قدرتمند، دقیق و با کیفیت به دادههای زیادی نیاز داریم. به عنوان مثال، چتبات ChatGPT بر روی ۵۷۰ گیگابایت داده متنی یا حدود ۳۰۰ میلیارد کلمه آموزش داده شده است.
به طور مشابه، الگوریتم انتشار پایدار(که پشت بسیاری از برنامههای تولید تصویر هوش مصنوعی مانند DALL-E، Lensa و Midjourney قرار دارد) بر روی مجموعه داده LIAON-۵B متشکل از ۵.۸ میلیارد جفت تصویر-متن آموزش داده شده است. اگر الگوریتمی روی مقدار ناکافی داده آموزش داده شود، خروجیهای نادرست یا با کیفیت پایین تولید میکند.
کیفیت دادههای آموزشی نیز مهم است. دسترسی به دادههای با کیفیت پایین مانند پستهای رسانههای اجتماعی یا عکسهای تار آسان است، اما برای آموزش مدلهای هوش مصنوعی با کارایی بالا کافی نیستند.
متنی که از سکوهای رسانههای اجتماعی گرفته میشود ممکن است مغرضانه یا تعصبآمیز باشد یا ممکن است حاوی اطلاعات نادرست یا محتوای غیرقانونی باشد که میتواند توسط مدل هوش مصنوعی تکرار شود.
به عنوان مثال، زمانی که مایکروسافت سعی کرد ربات هوش مصنوعی خود را با استفاده از محتوای توییتر آموزش دهد، دریافت که خروجیهای نژادپرستانه و زنستیز تولید میکند.
به همین دلیل است که توسعهدهندگان هوش مصنوعی به دنبال محتوای باکیفیت مانند متن از کتابها، مقالات آنلاین، مقالات علمی، ویکیپدیا و محتوای وب فیلتر شده خاص هستند. مثلا Google Assistant بر روی ۱۱ هزار رمان عاشقانه برگرفته از سایت خودانتشار Smashwords آموزش دیده است تا اطلاعات بیشتری در چنته داشته باشد.
آیا ما دادههای کافی داریم؟صنعت هوش مصنوعی، سیستمهای هوش مصنوعی را بر روی مجموعه دادههای بزرگتر آموزش میدهد، به همین دلیل است که ما اکنون مدلهایی با عملکرد بالا مانند ChatGPT یا DALL-E ۳ داریم.
در عین حال، تحقیقات نشان میدهد که ذخیره دادههای آنلاین بسیار کندتر از مجموعه دادههای مورد استفاده در حال رشد برای آموزش هوش مصنوعی هستند.
در مقالهای که سال گذشته منتشر شد، گروهی از پژوهشگران پیشبینی کردند که اگر روند آموزشی فعلی هوش مصنوعی ادامه یابد، قبل از سال ۲۰۲۶ دادههای متنی با کیفیت بالا تمام خواهد شد.
آنها همچنین تخمین زدند که دادههای زبانی با کیفیت پایین بین سالهای ۲۰۳۰ تا ۲۰۵۰ و دادههای تصویری با کیفیت پایین بین سالهای ۲۰۳۰ تا ۲۰۶۰ به پایان میرسد.
به گفته گروه مشاوره و حسابداری PwC، هوش مصنوعی تا سال ۲۰۳۰ میتواند تا ۱۵.۷ تریلیون دلار به اقتصاد جهان کمک کند. اما تمام شدن دادههای قابل استفاده میتواند توسعه آن را آهسته کند.
آیا باید نگران باشیم؟در حالی که نکات بالا ممکن است برخی از طرفداران هوش مصنوعی را نگران کند، این وضعیت ممکن است آنقدرها هم که به نظر میرسد بد نباشد.
ناشناختههای زیادی در مورد چگونگی توسعه مدلهای هوش مصنوعی در آینده و همچنین چند راه برای مقابله با خطر کمبود داده وجود دارد.
یکی از فرصتها برای توسعهدهندگان هوش مصنوعی است که الگوریتمها را بهبود ببخشند تا از دادههایی که در حال حاضر در اختیار دارند به طور کارآمدتر استفاده کنند.
این احتمال وجود دارد که در سالهای آینده آنها بتوانند سیستمهای هوش مصنوعی با عملکرد بالا را با استفاده از دادههای کمتر و احتمالاً قدرت محاسباتی کمتر آموزش دهند. این همچنین به کاهش ردپای کربن هوش مصنوعی کمک میکند.
گزینه دیگر استفاده از هوش مصنوعی برای ایجاد دادههای مصنوعی برای آموزش سیستمهاست. به عبارت دیگر، توسعهدهندگان به سادگی میتوانند دادههای مورد نیاز خود را تولید کنند که متناسب با مدل هوش مصنوعی خاص آنها باشد.
چندین پروژه در حال حاضر از محتوای مصنوعی استفاده میکنند که اغلب از سرویسهای تولید داده مانند Mostly AI تهیه میشود. این امر در آینده رایجتر خواهد شد.
توسعه دهندگان همچنین به دنبال محتوایی خارج از فضای آنلاین رایگان هستند، مانند محتوایی که توسط ناشران بزرگ و مخازن آفلاین نگهداری میشود. به میلیونها متن منتشر شده قبل از دوران فراگیری اینترنت فکر کنید.
آنهایی که به صورت دیجیتالی درنیامدهاند و در دسترس قرار بگیرند، میتوانند منبع جدیدی از دادهها را برای پروژههای هوش مصنوعی فراهم کنند.
بنیاد News Corp یکی از بزرگترین دارندگان محتوای خبری در جهان اخیراً اعلام کرده است که در حال مذاکره با توسعهدهندگان هوش مصنوعی برای قراردادهای محتواست.
چنین معاملاتی شرکتهای هوش مصنوعی را مجبور میکند برای دادههای آموزشی پول بپردازند، در حالی که تاکنون بیشتر آنها را به صورت رایگان از اینترنت حذف کردهاند.
سازندگان محتوا نسبت به استفاده غیرمجاز از محتوای خود برای آموزش مدلهای هوش مصنوعی اعتراض کردهاند و برخی از شرکتهایی مانند مایکروسافت، OpenAI و Stability AI شکایت کردهاند.
دریافت پاداش برای کار آنها ممکن است به بازگرداندن برخی از عدم تعادل قدرت بین خلاقان و شرکتهای هوش مصنوعی کمک کند.
کانال عصر ایران در تلگراممنبع: عصر ایران
کلیدواژه: هوش مصنوعی داده
درخواست حذف خبر:
«خبربان» یک خبرخوان هوشمند و خودکار است و این خبر را بهطور اتوماتیک از وبسایت www.asriran.com دریافت کردهاست، لذا منبع این خبر، وبسایت «عصر ایران» بوده و سایت «خبربان» مسئولیتی در قبال محتوای آن ندارد. چنانچه درخواست حذف این خبر را دارید، کد ۳۹۰۷۲۵۱۲ را به همراه موضوع به شماره ۱۰۰۰۱۵۷۰ پیامک فرمایید. لطفاً در صورتیکه در مورد این خبر، نظر یا سئوالی دارید، با منبع خبر (اینجا) ارتباط برقرار نمایید.
با استناد به ماده ۷۴ قانون تجارت الکترونیک مصوب ۱۳۸۲/۱۰/۱۷ مجلس شورای اسلامی و با عنایت به اینکه سایت «خبربان» مصداق بستر مبادلات الکترونیکی متنی، صوتی و تصویر است، مسئولیت نقض حقوق تصریح شده مولفان در قانون فوق از قبیل تکثیر، اجرا و توزیع و یا هر گونه محتوی خلاف قوانین کشور ایران بر عهده منبع خبر و کاربران است.
خبر بعدی:
کیفیت بخشی مدارس مهمتر از توسعه کمی آن است
ایسنا/سیستان و بلوچستان نماینده ولیفقیه در سیستان و بلوچستان گفت: دستگاه آموزش و پرورش احیا کننده نسل جدید ما میباشد و کاری که خیرین در حوزه تعلیم و تربیت انجام میدهند از جهات مختلف ارزشمند است.
آیتالله مصطفی محامی شامگاه جمعه در همایش استانی خیرین مدرسه یار ضمن قدردانی از حضور و مشارکت خیرین در برنامهها و فعالیتهای دستگاه تعلیم و تربیت اظهار کرد: خداوند متعال در قرآن کریم بیان داشته: "وَمَنْ أَحْیَاهَا فَکَأَنَّمَا أَحْیَا النَّاسَ جَمِیعًا" زنده کردن یک انسان همانند حیات بخشیدن به کل جامعه و زنده کردن همه انسانهاست و در مقابل آن عنوان میکند:" مَنْ قَتَلَ نَفْسًا بِغَیْرِ نَفْسٍ أَوْ فَسَادٍ فِی الْأَرْضِ فَکَأَنَّمَا قَتَلَ النَّاسَ جَمِیعًا" اگر یک نفر را از بین ببرد مانند این است که همه مردم را از بین ببرد.
امام جمعه زاهدان افزود: در تفسیر این آیه شریفه، بزرگان نظرات مختلفی را عنوان کردهاند از اینکه یک تشبیه برای بیان عظمت کار بوده و یا با این تعبیر که یک فرد میتواند مبدا تولید نسل باشد و لذا احیای یک نفر احیای یک نسل است.
آیتالله محامی بیان کرد: در ادبیات قرآنی حیات منحصر به این حیات مادی نیست بلکه عقل، اندیشه و علم اوست و بر این اساس دستگاه آموزش و پرورش و تعلیم و تربیت دستگاه احیا کننده نسل جدید ما میباشد لذا کاری که شما در آموزش و پرورش انجام میدهید از جهات مختلف ضریب میخورد.
وی ادامه داد: بر اساس همین نگاه انجام کار خیر در حوزه آموزش و پرورش نیز دارای ارزش افزوده است به خصوص که این کار در یک استان پهناور همچون سیستان و بلوچستان صورت میگیرد چرا که سیستان و بلوچستان دارای ظرفیتها و توانمندیهای زیادی است و یکی از این ظرفیتها وجود نیروهای با استعداد است که متاسفانه به درستی شکوفا نشده و مورد استفاده قرار نگرفته و نیازمند توجه ویژه است.
امام جمعه زاهدان تصریح کرد: خیرین باید قدر خود را بدانند و خداوند متعال را برای این نعمت، موهبت و لطفی که شامل حالشان کرده شکرگزاری کنند.
نماینده ولی فقیه در سیستان و بلوچستان خاطرنشان کرد: این احیا دارای فرایندی است که بخشی در تامین امکانات و سخت افزار و بخشی در تهیه نرم افزار از جمله برنامه، معلم و اساتید است و این دو مجموعه باید با هم هماهنگ و در یک راستا حرکت کنند.
وی عنوان کرد: مهمتر از توسعه کمی مدارس کیفیت بخشی به آنهاست و در این جهت نیازمند استفاده از نیروهای توانمند و با تجربه هستیم که از جمله کمبودهای ماست و باید در جهت آموزش نیروها برنامهریزی صورت گیرد و باید دقت کنید که مدارس پس از ساخت رها نشوند و در گام بعد باید تلاش کنید تا کیفیت خدمات در مدارس ارتقا پیدا کند.
آیتالله محامی بیان کرد: سیستان و بلوچستان یک استان پهناور است و بسیاری از روستاها پراکنده هستند و طبعأ ساخت مدارس در همه این نقاط امکان پذیر نیست و باید در نقاطی با تمرکز جمعیت ساخت مدارس شبانهروزی را دنبال کنیم که در این صورت با توجه به حضور دانش آموزان در مدارس فرصت تعلیم و تربیت بیشتر به صورت شبانه روزی وجود دارد.
وی عنوان کرد: دل کودکان مانند یک کاغذ سفید است و موقعیت شکل گیری شخصیت عقلانی، علمی، فرهنگی، اخلاقی و... در همین دوران کودکی است و اگر در این ایام کار به خوبی صورت گیرد این دانش آموز در آینده پا به هر عرصهای که بگذارد راه درست را خواهد رفت و در غیر این صورت چندان فرد موثری نخواهد بود.
انتهای پیام