به نقل از تک کرانچ، شرکت چینی دیپسیک یک پیشنمایش از مدل زبانی جدید خود با نام «دیپسیک وی۴» منتشر کرده است؛ مدلی که نسخه بهروزشده مدل وی۳.۲ و مدل استدلالی آر۱ محسوب میشود. این شرکت میگوید هر دو نسخه «وی۴ فلش» و «وی۴ پرو» از معماری «ترکیب متخصصها» استفاده میکنند و میتوانند تا یک میلیون توکن را در حافظه خود نگه دارند؛ یعنی توانایی پردازش حجم بسیار بزرگی از متن، مانند کدهای برنامهنویسی یا اسناد طولانی را دارند. این مدلها فقط بخشی از پارامترها را در هر کار فعال میکنند تا هزینه پردازش کمتر شود.
مدل بزرگتر یعنی وی۴ پرو در مجموع ۱.۶ تریلیون پارامتر دارد که حدود ۴۹ میلیارد آن فعال است و از این نظر یکی از بزرگترین مدلهای متنباز جهان محسوب میشود. نسخه کوچکتر یعنی وی۴ فلش نیز ۲۸۴ میلیارد پارامتر دارد که ۱۳ میلیارد آن فعال است. دیپسیک ادعا میکند این مدلها نسبت به نسل قبلی خود یعنی وی۳.۲ هم کارآمدتر و هم قویتر شدهاند و در آزمونهای استدلالی، فاصله خود را با مدلهای پیشرفته جهانی بسیار کم کردهاند.
تمام حقوق برای پایگاه خبری ، تحلیلی هفت مهر محفوظ می باشد کپی برداری از مطالب با ذکر منبع بلامانع می باشد.
طراحی توسط فامو