Այլ

DeepSeek-ը խոստանում է նոր յեղափոխութիւն ԱԲ-ում. արդիւնաւէտութիւն՝ պարգեւատրման միջոցով

Յայտնի չինական ստարտափ DeepSeek-ը, որն արդէն փառք է ձեռք բերել իր R1 մոդելով՝ աչքի ընկնող մտածողական ունակութիւններով, կրկին յայտնւել է ուշադրութեան կենտրոնում: Այս անգամ ընկերութիւնը յայտարարել է արհեստական բանականութեան ուսուցման բեկումնային մեթոդի մասին, որը մշակւել է Ցինհուայի համալսարանի հետազօտողների հետ համագործակցութեամբ: Ինչպէս յայտնում է South China Morning Post (SCMP)-ը, նոր մօտեցումը խոստանում է զգալիօրէն բարձրացնել մեծ լեզւական մոդելների (LLM) արդիւնաւէտութիւնը՝ դարձնելով դրանք աւելի ճշգրիտ եւ տնտեսող: Նորարարութեան մանրամասները բացայայտւել են անցեալ շաբաթ հրապարակւած յօդւածում:

 

Ի՞նչ է նոր մեթոդի էութիւնը

DeepSeek-ը ներկայացրել է տեխնիկա, որը համատեղում է պարգեւատրման գեներատիւ մոդելաւորումը (GRM) եւ ինքնաքննադատական կարգաւորումը՝ հիմնւած սկզբունքների վրայ (self-principled critique tuning): Այս մեթոդը նպատակ ունի ԱԲ-ն աւելի լաւ համապատասխանեցնել մարդկային սպասումներին՝ խթանելով այն աւելի որակեալ պատասխաններ տալու դրական ամրապնդման համակարգի միջոցով: Եթէ աւանդական ուսուցումը ամրապնդմամբ (reinforcement learning) լաւ է աշխատում նեղ առաջադրանքներում, ապա ընդհանուր սցենարներում նրա արդիւնաւէտութիւնն ընկնում էր: DeepSeek-ը վերացնում է այս խոչընդոտը՝ համատեղելով GRM-ը ինքնակարգաւորման մեխանիզմի հետ:

Հետազօտութեան տւեալներով՝ DeepSeek-GRM մոդելները գերազանցում են առկայ անալոգներին: Դրանք ոչ միայն աւելի ճշգրիտ են մշակում բարդ եւ ընդհանուր հարցումները, այլեւ պահանջում են աւելի քիչ հաշւողական ռեսուրսներ: Սա յատկապէս կարեւոր է համաշխարհային մրցակցութեան պայմաններում, որտեղ ԱԲ-ի ուսուցման ծախսերի կրճատումը դառնում է առանցքային առաւելութիւն:

 

DeepSeek-GRM. բաց կոդ եւ հեռանկարներ

Նոր մոդելները կոչւել են DeepSeek-GRM (Generalist Reward Modeling)՝ ընդգծելով դրանց բազմակողմանիութիւնը: Ընկերութիւնը նախատեսում է դրանք հասանելի դարձնել բաց սկզբնակոդով՝ հետեւելով համայնքի հետ իր մշակումները կիսելու աւանդոյթին: Յիշեցնենք, որ 2025-ի սկզբին DeepSeek-ն արդէն ցնցել էր շուկան՝ թողարկելով R1 մոդելը, որը գերազանցել էր արեւմտեան բազմաթիւ անալոգներին՝ աւելի քիչ ծախսերով: Սակայն GRM մոդելների թողարկման ճշգրիտ ամսաթիւ դեռ չկայ. հետազօտողները միայն հաստատել են ապագայում դրանք բացելու մտադրութիւնը:

 

Ինչո՞ւ է սա կարեւոր

DeepSeek-GRM-ի յաջողութիւնը կարող է հերթական հարւածը դառնալ OpenAI-ի նման ամերիկեան ԱԲ-հսկաների անհասանելի առաջատարութեան մասին առասպելին: Չինական ստարտափն ապացուցում է, որ արհեստական բանականութեան ոլորտում նորարարութիւնները չեն պահանջում միլիարդաւոր դոլարներ եւ ամենաառաջադէմ չիպերին հասանելիութիւն: Ցինհուայի համալսարանի հետ համագործակցութիւնը ընդգծում է DeepSeek-ի յաջողութեան մէջ ակադեմիական բազայի դերը. տեղական մասնագէտներն օգնել են ստեղծել մեթոդ, որը օպտիմալացնում է ռեսուրսները եւ բարձրացնում մոդելների յարմարւողականութիւնը:

Թեստաւորումը ցոյց է տւել, որ GRM մոդելները յատկապէս արդիւնաւէտ են մտածողութիւն եւ մարդկային ընկալմանը մօտ տեքստի գեներացիա պահանջող առաջադրանքներում: Սա հեռանկարներ է բացում դրանց օգտագործման համար տարբեր ոլորտներում՝ սկսած չաթ-բոտերից մինչեւ վերլուծութեան եւ կրթութեան ավտոմատացում:

 

Ի՞նչ սպասել յետոյ

DeepSeek-ը շարունակում է փոխել խաղի կանոնները համաշխարհային ԱԲ-արդիւնաբերութիւնում: R1-ի յաջողութիւնից յետոյ, որը 2025-ի յունւարին 1 տրիլիոն դոլարով ընկճել էր ամերիկեան տեխնո-հսկաների բաժնետոմսերը, նոր յայտարարութիւնն աւելի է ուժեղացնում ընկերութեան յաջորդ մոդելի շուրջ սպասումները: Եթէ GRM-ն արդարացնի խոստումները, դա կարող է արագացնել արդյունաբերութեան անցումը ավելի մատչելի եւ արդիւնաւէտ լուծումների, որտեղ Չինաստանը կը դառնայ առաջատար ոչ միայն արժէքով, այլեւ որակով:

Թէեւ թողարկման ժամկէտները մնում են առեղծւած, մի բան յստակ է՝ DeepSeek-ը չի պատրաստւում կանգ առնել: Հանչժոուից ծագած այս ստարտափը կրկին ապացուցում է, որ ԱԲ-ի յեղափոխութիւնը կարող է գալ ոչ թէ Սիլիկոնային հովտից, այլ Չինաստանից՝ բաց կոդով եւ թարմ գաղափարներով:

News.am

Related Articles

Back to top button