افزایش اطلاعات؛ افزایش قدرت/ ساخت و ساز داخلی LLM

داده بیشتر؛ قدرت بیشتر/ تولید داخلی LLM


یک همایش با عنوان «الزامات توسعه مدل زبانی بزرگ فارسی» با هدف بررسی اهمیت AI و مکاترونیک برگزار شد. در این همایش به تاریخچه توسعه فناوری AI پرداخته شد و نوع جدید سیستم های AI که از داده کاوی تا سیستم مدل زبانی تکامل یافته اند مورد بررسی قرار گرفت. از سوی دیگر، مهمیت حکمرانی داده و اهمیت LLM برای یک کشور نیز مطرح شد. این همایش با معرفی اولین ورژن با پیکره mistrial ۷ میلیاردی و حجم ۳۵ میلیارد توکن توانایی پاسخگویی به سوالات حقوقی را دارا است.

به گزارش دیجیاتور به نقل از معاونت علمی، فناوری و دانش مالی دانش بنیان ریاست جمهوری، همایش «الزامات توسعه مدل زبانی بزرگ فارسی» با شعار «AI، مولد قدرت حکومت ها» به همت ستاد توسعه فناوری های AI و مکاترونیک معاونت علمی در محل پژوهشگاه مخابرات و تکنولوژی مخابرات برگزار شد.

بهروز مینایی، دبیر ستاد توسعه فناوری های AI و مکاترونیک در بحث خود به سیر تطور فناوری AI تا به امروز پرداخت و گفت: در دهه های ۱۹۷۰ تا ۱۹۸۰ «سیستم‌های خبره» (Expert systems)، فناوری غالب در دنیای «AI» بود که به عنوان یک پایگاه دانشی عمل می کرد و برآمده از تلاش های محققان بود که اساسا کاری به حوزه ساخت و ساز نداشت و بیشتر در پی تشخیص بود.

به گفته او در ۱۹۹۰ گام مهمی در حوزه AI برداشته شد و «داده کاوی» به میدان آمد. در این نسل از فناوری های AI، دیگر نیازی نبود که داده ها از یک متخصص گرفته شود و افراد تنها از رهگذر اطلاعات می‌توانستند به یک الگو برسند.

مینایی، تفاوت «سیستم‌های خبره» با سیستم‌های «داده‌کاوی» را در میزان دقت آنها عنوان کرد و گفت: سیستم‌های خبره از دقت بالاتری در مقایسه با سیستم های داده کاوی برخوردارند، اما در مقابل، داده‌کاوی‌ها، توان کار روی داده های سنگین را دارا هستند.

وی در ادامه به «سیستم‌های دیپ لرنینگ» اشاره و تاکید کرد: این نوع سیستم ها در شناخت تصاویر به اندازه انسان توانایی دارند و می‌توانند لایه‌های مختلف از شبکه های عصبی را ایجاد کنند.

به گفته او در فاصله ۲۰۱۲تا ۲۰۱۸ «سیستم مدل‌های زبانی» طراحی شد، این سیستم ها، می توانند رابطه یک کلمه را در بستر اطرافش ببینند و بردارها را با هم نسبت سنجی کنند، و این نسبت سنجی ها می تواند درک مطلب را در این سیستم ها عمیق تر کند.

مینایی، مزیت نسل جدید سیستم‌های AI را در مقایسه با گذشته، محدود نبودن توان آنها به یک دامنه خاص و افزایش توان افقی آنها دانست که در مدارهای معنایی و درک مطلب از اهمیت بالایی برخوردار است.

وی با بیان اینکه LLM ها سوگیری خاصی را از نظر فرهنگی و ارزشی ایجاد می‌کنند، تصریح کرد: یک نوع پلورالیسم عقیدتی و اجتماعی بر دنیای استفاده از LLM ها حاکم است و بنا بر نوع پرسشی که در آن‌ها طرح شود، پاسخ های متفاوتی ارائه خواهند کرد.

از این رو، به باور مینایی، مهم‌ترین سوگیری استفاده از LLM‌ها، سوگیری «داده» است و در این فضا، حکمرانی داده، یک ضرورت است و هر کشوری که داده بیشتری داشته باشد از قدرت بیشتری برخوردار است و به همین دلیل ما باید LLM بومی خودمان را داشته باشیم.

وی در پایان خاطرنشان کرد: کاری را که ستاد توسعه دانش مالی دانش بنیان دیجیتال معاونت علمی پایه گذاری کرد و ما هم ادامه آن را سرلوحه خود قرار داده ایم، ساخت و ساز داخلی LLM است و این جلسه هم برای رونمایی از اولین ورژن با پیکره mistrial ۷ میلیاردی و به حجم ۳۵ میلیارد توکن برگزار شده است. این پیکره با بهره‌گیری از حدود یک میلیون و ۴۰۰ پرسش و پاسخ حقوقی می تواند پاسخ های صحیح در خصوص سوالات حقوقی ارائه کند.

به گزارش مهر، مدل زبانی بزرگ large language model یا به اختصار ال‌ال‌ام LLM، سیستم های AI هستند که برای درک، ساخت و ساز و پاسخگویی به زبان انسان طراحی شده اند. آنها “بزرگ” هستند زیرا حاوی میلیاردها پارامتر هستند که به آنها امکان می دهد الگوهای پیچیده در داده های زبان را پردازش کنند.


الزامات توسعه مدل زبانی بزرگ در همایش “AI، مولد قدرت حکومت ها” مورد بحث قرار گرفته است. به تدریج فناوری AI از سیستم‌های خبره به سیستم‌های داده‌کاوی و سپس به سیستم‌های دیپ لرنینگ و سیستم‌های مدل‌های زبانی تکامل یافته است. پیشرفت‌های اخیر در حوزه AI به ما امکان می دهد الگوهای پیچیده در داده های زبان را به خوبی پردازش کنیم. استفاده از LLM‌ها، به منظور ایجاد یک نوع پلورالیسم عقیدتی و اجتماعی، بسیار مفید است. از این رو، ساخت و ساز این سیستم‌های AI در داخل کشور ضروری است تا بتوانیم از قدرت داده و توان تحلیلی آنها بهترین استفاده را برد.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *