مدل جدید دیپ‌سیک رونمایی شد

هوش مصنوعی دیپ سیک

به نقل از تک کرانچ، شرکت چینی دیپ‌سیک یک پیش‌نمایش از مدل زبانی جدید خود با نام «دیپ‌سیک وی۴» منتشر کرده است؛ مدلی که نسخه به‌روزشده مدل وی۳.۲ و مدل استدلالی آر۱ محسوب می‌شود. این شرکت می‌گوید هر دو نسخه «وی۴ فلش» و «وی۴ پرو» از معماری «ترکیب متخصص‌ها» استفاده می‌کنند و می‌توانند تا یک میلیون توکن را در حافظه خود نگه دارند؛ یعنی توانایی پردازش حجم بسیار بزرگی از متن، مانند کدهای برنامه‌نویسی یا اسناد طولانی را دارند. این مدل‌ها فقط بخشی از پارامترها را در هر کار فعال می‌کنند تا هزینه پردازش کمتر شود.

مدل بزرگ‌تر یعنی وی۴ پرو در مجموع ۱.۶ تریلیون پارامتر دارد که حدود ۴۹ میلیارد آن فعال است و از این نظر یکی از بزرگ‌ترین مدل‌های متن‌باز جهان محسوب می‌شود. نسخه کوچک‌تر یعنی وی۴ فلش نیز ۲۸۴ میلیارد پارامتر دارد که ۱۳ میلیارد آن فعال است. دیپ‌سیک ادعا می‌کند این مدل‌ها نسبت به نسل قبلی خود یعنی وی۳.۲ هم کارآمدتر و هم قوی‌تر شده‌اند و در آزمون‌های استدلالی، فاصله خود را با مدل‌های پیشرفته جهانی بسیار کم کرده‌اند.

هوش مصنوعی دیپ سیک

لینک کوتاه :

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *