در همایش الزامات توسعه «مدل زبانی بزرگ» فارسی صورت گرفت
رونمایی از کلان پیکره زبان فارسی با ۳۵ میلیارد کلمه
کلان پیکره زبان فارسی، بزرگترین مجموعه دادگان شامل ۳۵ میلیارد کلمه در همایش الزامات توسعه مدل زبانی بزرگ فارسی رونمایی شد.
به گزارش مرکز ارتباطات و اطلاعرسانی معاونت علمی، فناوری و اقتصاد دانش بنیان ریاست جمهوری، همایش الزامات توسعه مدل زبانی بزرگ فارسی با عنوان هوش مصنوعی مولد قدرت حکومت ها به همت ستاد توسعه فناوری های هوش مصنوعی و رباتیک ۲۰اسفندماه در پژوهشگاه ارتباطات و فناوری اطلاعات برگزار شد.
در این نشست، کلان پیکره زبان فارسی با حمایت ستاد توسعه فناوری های هوش مصنوعی و رباتیک و توسعه داده شده توسط شرکت ترگمان رونمایی شد.
این کلان پیکره با آزاد رسانی به صورت open source با تنوع بالا و حفظ بافتار متن در دسترس عموم قرار خواهد گرفت.
گفتنی است «مدل زبان بزرگ» یا LLM (Large language model)، یک نوع نوآوری در حوزه هوش مصنوعی است که از شبکه های عصبی با پارامترهای گسترده برای پردازش پیشرفته زبان استفاده میکند.
هوش مصنوعی مولد در یک سال اخیر بیشترین پیشرفت را به خود اختصاص داده و عمده سهم این پیشرفت متکی به مدلهای زبانی بزرگ(LLM ها) بوده است.
مدلهای زبان بزرگ یک نوع از مدلهای هوش مصنوعی است که توانایی پردازش اطلاعات چندجانبه را دارند. این مدلها از قدرت بینظیر خود در پردازش زبان برای ایجاد پاسخهای بهینه تر و بهتر به سوالات مختلف کاربران استفاده میکنند. در حال حاضر، طراحی و مهندسی دستورالعملهای بهینه برای این مدلها از اهمیت زیادی برخوردار است و تیمهای پژوهشی در دانشگاهها و مراکز تحقیقاتی مختلف به این موضوع توجه ویژهای دارند.
ارسال به دوستان