Համակարգիչներ, Տեղեկատվական տեխնոլոգիաների

Ժամանակակից համակարգչային vision. Խնդիրները եւ համակարգչային տեսողության տեխնոլոգիայով. Ծրագրավորում Համակարգիչ Վիժն է Python

Ինչպես սովորեցնել համակարգիչ է հասկանալ, թե ինչ է պատկերված նկարում պատկերված կամ պատկերներով. Սա, կարծես, պարզ, բայց մի համակարգչի սա ընդամենը մի մատրիցա, որը բաղկացած է zeros ու նորերը, որը դուք ցանկանում եք հանել կարեւոր տեղեկություններ:

Որն է համակարգչային vision. Դա հնարավորություն է «տեսնել» ձեր համակարգիչը

Vision - կարեւոր աղբյուր տեղեկատվության անձի համար, օգտագործելով այն, որ մենք ստանում, ըստ տարբեր հաշվարկների, սկսած 70 90% ամբողջ ինֆորմացիան: Եվ, իհարկե, եթե մենք ուզում ենք ստեղծել մի խելացի մեքենան, մենք պետք է իրականացնել նույն հմտությունները եւ համակարգչի համար.

Խնդիրը համակարգչային vision կարելի է ասել, բավականին հստակ. Որն է «տեսնել». Հասկանալի է, որ այնտեղ, որտեղ կան պարզապես փնտրում. Որ եզրափակեց տարբերությունները համակարգչային տեսողության եւ մարդկային տեսլականով: Տեսլականը մեզ համար - դա մի աղբյուր գիտելիքներ աշխարհի, ինչպես նաեւ մի աղբյուր մետրային տեղեկատվության, այսինքն, հնարավորություն է հասկանալ տարածություններ եւ չափերը:

Իմաստային միջուկ պատկերը

Նայում պատկերված, մենք կարող ենք նկարագրել այն մի շարք հատկանիշների, այսպես ասած, պետք է հանենք իմաստային տեղեկատվություն:

Օրինակ, նայելով այս նկարին, մենք կարող ենք ասել, որ դա դրսում. Թե ինչ է քաղաքը երթեւեկությունը. Որ կան ավտոմեքենաներ: մենք կարող ենք ենթադրել, որ սա Հարավ-Արեւելյան Ասիա կազմաձեւման շենքի եւ hieroglyphics: Դիմանկարը Մաո Ցզե Դունի հասկանում են, որ դա Պեկինը, եւ եթե որեւէ մեկը տեսավ, կենդանի տեսագրություն կամ ինքն էր եղել, չէր կռահել, որ սա հայտնի Տյանանմեն հրապարակում:

Այն, ինչ մենք կարող ենք ասել, ավելի շատ նկարի մասին, տեսնելով այն. Մենք կարող ենք բացահայտել օբյեկտների պատկերով, ինչպես ասում են, որ կան մարդիկ այստեղ ավելի մոտ - պարիսպ. Այստեղ հովանոցներ, այդ կառույցը պաստառները: Սրանք օրինակներ են դասերի շատ կարեւոր օբյեկտները, որոնք զբաղվում են որոնման պահին:

Դեռ մենք կարող ենք իմանալ, որոշ առանձնահատկությունների կամ հատկանիշների օբյեկտների. Օրինակ, այստեղ մենք կարող ենք որոշել, թե որ սա ոչ մի դիմանկարը սովորական չինական, մասնավորապես, Մաո Ցզե Դունի.

Ինչպես տեղեկացնում է մեքենայի, կարող է որոշվել, որ դա մի շարժվող օբյեկտ, եւ դա այն է, դժվար է, որ չի դեֆորմացվում ընթացքում շարժման. Օգտվողի դրոշները կարելի է ասել, որ դա չի առարկում, որ նրանք նույնպես շարժվում, բայց նրանք չեն դժվար է, անընդհատ դեֆորմացվում. Եւ որ դեպքի վայր է կա քամին, որը կարող է որոշվել զարգացող դրոշները, եւ կարող է նույնիսկ որոշել, թե որ ուղղությունը քամու, օրինակ, այն փչում ձախից աջ.

Հեռավորությունները եւ երկարությունները համակարգչային տեսլականի

Շատ կարեւոր է, որ մետրային մասին տեղեկատվությունը համակարգչային vision գիտության. Սա բոլոր տեսակի հեռավորությունների. Օրինակ, համար Rover- ը հատկապես կարեւոր է, քանի որ թիմերը Երկրից մոտ 20 րոպե, եւ պատասխանել, քանի որ շատ. Ըստ այդմ, հղում կա եւ ետ - 40 րոպե: Եւ եթե մենք կատարել պլանը շարժման հրամանների Երկրի, դուք պետք է դա հաշվի.

Հաջողությամբ ինտեգրվել տեխնոլոգիան համակարգչային vision Տեսախաղեր. Ըստ տեսանյութի, դուք կարող եք կառուցել եռաչափ մոդելներ օբյեկտների, մարդկանց, եւ լուսանկարները օգտվողը կարող է վերականգնել եռաչափ մոդելներ քաղաքների. Եւ ապա քայլել նրանց.

համակարգչային vision - բավականին լայն շրջանակ: Այն սերտորեն միահյուսված տարբեր այլ գիտություններին: Մասը համակարգչային տեսլականի Այն գրավում է պատկերի վերամշակման տարածքը եւ երբեմն հատկացնում համակարգչային տեսլականը, պատմականորեն.

Վերլուծություն, օրինակը ճանաչման ուղին ստեղծման վերադաս հետախուզության

Քննենք այս հասկացությունները առանձին-առանձին:

Image Processing - սա մի տարածք ալգորիթմների, որի Մուտքային եւ ելքային - Image, եւ մենք նրան ինչ որ բան անել:

պատկերի վերլուծությունը - տարածքը համակարգչային vision, որը կենտրոնանում է աշխատել հետ երկչափ պատկերով եւ հետեւություններ են սա:

Կերպարների ճանաչման - վերացական մաթեմատիկական կարգապահությունը, որը ճանաչում է տվյալների ձեւով վեկտորներից. Այսինքն, մուտքի - վեկտորի եւ մենք ինչ - որ բան պետք է անել դրա հետ: Որտեղ վեկտորը, մենք ոչ այնքան կարեւոր է իմանալ, թե.

Համակարգչային vision - դա ի սկզբանե եղել է վերականգնել կառուցվածքը երկչափ պատկերներ. Այսօր այս տարածքը դարձել է ավելի լայն է եւ այն կարելի է մեկնաբանել որպես ընդունման բոլոր ֆիզիկական օբյեկտների կայացման հիման վրա պատկերով: Այսինքն, դա այն է, որ խնդիրն արհեստական ինտելեկտի.

Հետ զուգահեռ համակարգչային vision է բոլորովին այլ դաշտում, գեոդեզիայի, photogrammetry դարձել, մի չափում միջեւ հեռավորությունը օբյեկտների վրա երկչափ պատկերներ.

Ռոբոտներ կարող է «տեսնել»

Եւ, վերջապես, - սա մեքենա տեսլականը: Տակ մեքենա տեսլականի նշանակում է տեսլականը ռոբոտներ. Այն է, որ որոշումը որոշ արտադրական խնդիրների. Մենք կարող ենք ասել, որ համակարգչային vision - մի մեծ գիտությունը: Այն համատեղում որոշ մյուս գիտության մասով: Եւ երբ համակարգչային vision ստանում որեւէ կոնկրետ ծրագիր, այն վերածվում է մի մեքենա տեսլականի:

Համակարգչային vision տարածաշրջանը ունի զանգված գործնական կիրառություններ: Այն կապված է ավտոմատացման արտադրանքի. Ձեռնարկություններում դառնալ ավելի արդյունավետ է փոխարինել ֆիզիկական աշխատանք է մեքենայի. Այդ մեքենան չի հոգնում, ոչ քնած, նա ստիպված էր անկանոն աշխատանքային գրաֆիկը, նա պատրաստ է աշխատել 365 օր տարվա. Այնպես որ, օգտագործելով մեքենա աշխատանքը, որ մենք կարող ենք ստանալ երաշխավորված արդյունք է որոշակի ժամանակ, եւ դա շատ հետաքրքիր է. Բոլոր խնդիրները պետք է հստակ օգտագործելու համար համակարգչային տեսողության համակարգեր. Եւ չկա ոչինչ ավելի լավ է, քան տեսնել արդյունքները անմիջապես պատկերված միայն Հաշվառման փուլում:

Շեմին աշխարհի արհեստական ինտելեկտի

Գումարած տարածքը, դա դժվար է! Մի զգալի մասը ուղեղի համար պատասխանատու տեսլականի, եւ ենթադրվում է, որ եթե դուք սովորեցնել ձեր համակարգիչը է «տեսնել», այսինքն, լրիվ օգտագործումը համակարգչային vision, դա մեկն է այն նպատակներից լրիվ արհեստական ինտելեկտի. Եթե մենք կարող ենք լուծել խնդիրը մարդկային մակարդակով, ամենայն հավանականությամբ, միեւնույն ժամանակ, մենք կլուծենք խնդիրը AI. Դա շատ լավ է! , Թե ոչ, շատ լավ է, եթե դուք նայեք, «Տերմինատոր 2»:

Ինչու է այդ տեսլականը, դժվար: Քանի որ պատկերը նույն առարկայի կարող է տարբերվել մեծապես կախված է արտաքին գործոններից: Կախված նրանից, թե որ օբյեկտն դիտակետերում նայում տարբեր.

Օրինակ, մեկ եւ նույն գործիչ, վերցված տարբեր անկյուններից: Եւ այն, ինչ առավել հետաքրքիր է այդ թիվը կարող է լինել մի աչքը, երկու աչքերը ու կես: Եւ կախված համատեքստից (եթե այս պատկերը մարդու մի վերնաշապիկ ներկված աչքերով), աչքը կարող է լինել շատ ավելի, քան երկու:

Համակարգչային դեռ չի հասկանում, բայց դա «տեսնում»

Մեկ այլ գործոն, որ ստիպում է դա դժվար դա լուսավորման. Նույն վայրից տարբեր լուսավորման կանդրադառնա տարբեր են. օբյեկտ չափը կարող է տարբեր լինել: Ավելին, օբյեկտները ցանկացած դասի. Ինչպես կարող եք ասել մի մարդու մասին, որը իր բարձրությունը 2 մետր. Ոչինչ. Մարդկային աճ եւ կարող է լինել 2.3 մ, եւ 80 սմ. Որպես այլ տեսակի օբյեկտների, սակայն, այն օբյեկտներն են նույն դասարանում:

Մասնավորապես ապրող օբյեկտների ենթարկվում է մի շարք strains. Մազերի մարդիկ, մարզիկներ, կենդանիների. Նայում պատկերներով ձիերով վազում, որոշելու, թե ինչ է կատարվում իրենց Մանե եւ պոչը, պարզապես անհնար է: A overlapping օբյեկտների պատկերով: Եթե դուք հրել համակարգչային պատկեր, նույնիսկ առավել հզոր մեքենան դժվարանում է տալ ճիշտ որոշում:

Հաջորդ տեսք - դա մի քողարկել. Որոշ օբյեկտներ, կենդանիներ masquerading որպես շրջակա միջավայրի, եւ շատ հմտորեն. Եւ նույն ԿԵՏԵՐ եւ գունավորում. Այնուամենայնիվ, մենք տեսնում ենք նրանց, թեեւ միշտ չէ, որ հեռվից:

Մեկ այլ խնդիր է, որ շարժումը. Օբյեկտների շարժման աներեւակայելի ենթարկվում ձեւախախատման:

Շատերը օբյեկտների շատ փոփոխական. Այստեղ, օրինակ, երկու լուսանկարներում ստորեւ օբյեկտների «ամբիոնի»:

Եւ այդ դուք կարող եք նստել: Բայց սովորեցնել մի մեքենա, այնպիսին է, որ տարբեր բաներ ձեւի, գույնի, նյութական, ամեն ինչ օբյեկտ "աթոռ", - շատ դժվար է. Սա մարտահրավեր է: Է ինտեգրվել մեթոդներ համակարգչային vision - ն է սովորեցնել մի մեքենա է հասկանալ, վերլուծել, շահարկել.

Ինտեգրումը համակարգչային տեսողության տարբեր հարթակներում

Զանգվածը համակարգչային vision սկսեցին թափանցել ավելի է 2001 թվականին, երբ նա ստեղծեց առաջին դեմքը դետեկտորին: Մենք արել ենք այն, երկու հեղինակները: Viola, Jones. Այն առաջինն էր արագ եւ հուսալի բավարար է ալգորիթմ, որը ցույց տվեց, որ իշխանությունը մեքենա ուսուցման մեթոդների.

Այժմ համակարգչային vision պետք բավականաչափ նոր գործնական ծրագրեր ճանաչումը մարդկային դեմքը:

Բայց պետք է ճանաչի այն մարդուն, քանի որ կինոթատրոն - պատահական անկյուններից, տարբեր լուսավորման պայմաններում, դա անհնար է: Բայց լուծել խնդիրը, կամ մեկը, որ տարբեր մարդկանց հետ տարբեր լուսավորման կամ մեկ այլ դիրքով, նման քանի որ լուսանկարի անձնագրում, դա հնարավոր է բարձր աստիճանի վստահության.

անձնագրի լուս պահանջները հիմնականում պայմանավորված է առանձնահատկությունն է դեմքի ճանաչման ալգորիթմներ.

Օրինակ, եթե դուք ունեք մի կենսաչափական անձնագիր, որոշ ժամանակակից օդանավակայաններում, դուք կարող եք օգտագործել ավտոմատ անձնագրային հսկողության համակարգ:

Չլուծված խնդիր է համակարգչային vision - ի կարողությունը ճանաչել որեւէ տեքստ

Գուցե ինչ - որ մեկը, որն օգտագործվում OCR համակարգ. Դրանցից մեկը, մի Fine Reader, շատ սիրված է Ռունետի համակարգում. Կան բազմաթիվ ձեւեր, որտեղ դուք լրացնում տվյալները, նրանք կատարելապես տեսածրված, որ տեղեկատվությունը կողմից ճանաչված համակարգի շատ լավ: Բայց ցանկացած տեքստի մեջ պատկերված իրավիճակը շատ ավելի վատ. Այս խնդիրը դեռեւս մնում է չլուծված:

Խաղեր, այդ թվում համակարգչային տեսլականը, միջնորդությունը գրավումը

Առանձին մեծ տարածքը - ի ստեղծումը եռաչափ մոդելների եւ կինոյի գրավման (որը բավականին հաջողությամբ իրականացվում է համակարգչային խաղերի): Առաջին ծրագիրը, որը օգտագործում է համակարգչային տեսլականը համակարգ փոխազդեցության հետ համակարգչային ժեստերով: Երբ այն ստեղծվել է, որ դա եղել է շատ բաներ բաց:

Իսկ ալգորիթմը նախատեսված է բավականին պարզապես, բայց պետք է կարգավորել այն տեւել է ստեղծել գեներատոր սինթետիկ պատկերների մարդկանց ստանալ մեկ միլիոն նկարներ: Սուպերհամակարգիչը նրանց հետ է ընտրել պարամետրերը ալգորիթմի, որի համար նա այժմ աշխատում է:

Դա այն է, մեկ միլիոն պատկերները եւ շաբաթ հաշվելի սուպերհամակարգիչը ժամանակն հնարավոր է ստեղծել մի ալգորիթմ, որը կլանում է 12% հզորության մեկ պրոցեսոր եւ թույլ է տալիս մարդուն ընկալելու դիրքորոշումը իրական ժամանակում: Դա Microsoft Kinect համակարգը (2010):

Որոնել պատկերների կողմից բովանդակության թույլ է տալիս Ձեզ նկարներ վերբեռնելու համակարգի, իսկ արդյունքները դրա կտա բոլոր նկարները հետ նույն բովանդակությամբ եւ կատարվում է նույն տեսանկյունից:

Օրինակներ համակարգչային vision. Եռաչափ եւ երկչափ քարտեզներ այժմ արվում դրա հետ: Maps for նավարկություն ավտոմեքենաների պարբերաբար թարմացվում են, ըստ DVR:

Կա մի տվյալների բազայի միլիարդավոր geotagged լուսանկարներ. Բեռնել նկարը տվյալների բազայում, դուք կարող եք որոշել, թե որտեղ է այն արվել, եւ նույնիսկ ինչ - որ հեռանկարով: Իհարկե, պայմանով, որ տեղ է վայելում բավական է, որ մի ժամանակ զբոսաշրջիկները եւ պատրաստված մի շարք լուսանկարներ տարածքում եղել են այնտեղ:

ռոբոտներ են ամենուր

Ռոբոտիկայի է ներկա ժամանակ, ամենուր, առանց դրա որեւէ կերպ. Այժմ մեքենաներ կան, որոնք ունեն հատուկ տեսախցիկներ, որոնք ճանաչել հետիոտներին եւ ճանապարհային նշաններ փոխանցելու հրամանները, ինչպես նաեւ վարորդի (սա յուրօրինակ համակարգչային ծրագիր դիտելու, օգնում է ավտոմոբիլիստ): Եվ կա մի լիովին ավտոմատացված robotic տրանսպորտային միջոցների, բայց նրանք չեն կարող ապավինել տեսախցիկ համակարգի, առանց օգտագործման մեծ քանակությամբ լրացուցիչ տեղեկատվություն:

Ժամանակակից տեսախցիկ - սա անալոգային տեսախցիկ Obscura

Եկեք խոսենք այն մասին, թվային պատկերով: Ժամանակակից թվային տեսախցիկները, որոնք կազմակերպվում են սկզբունքի օբսկուր: Միայն թե անցքը, որի միջոցով լույսը մտնում է լազեր եւ կանխատեսվող վրա հետեւի պատին պալատի առարկայի միացում, մենք ունենք հատուկ օպտիկական համակարգ, որը կոչվում է պատկերընկալ: Նրա նպատակն է հավաքել մի մեծ թեթեւ beam եւ վերափոխելու այն այնպես, որ բոլոր ճառագայթները անցնում է վիրտուալ կետ, որպեսզի ձեռք բերել նախագծումը եւ ձեւավորել պատկեր ֆիլմի կամ մատրիցով.

Ժամանակակից թվային տեսախցիկները (matrix), որը բաղկացած է առանձին տարրերի `փիքսել. Յուրաքանչյուր կարող է անկախ ղեկավարվել կարող չափել էներգիան լույսի, որը միջադեպը կարող է անկախ ղեկավարվել ընդամենը, եւ թողարկել արտադրանքի համարը: Հետեւաբար, թվային ֆոտոխցիկ, մենք ստանում փոխարեն պատկերի պայծառությունը սահմանված թեթեւ չափումների, բռնել է մեկ կարող է անկախ ղեկավարվել - համակարգչային դաշտի տեսանկյունից: Հետեւաբար, երբ պատկերը մենք տեսնում ենք, չի հոսում գծերի եւ հստակ ուրվագիծն է, եւ մի ցանց գունավոր քառակուսիների տարբեր գույների - փիքսել.

Ստորեւ կարող եք տեսնել, որ առաջին թվային պատկերը աշխարհում:

Բայց այս նկարի չէ: Գույն. Որն է գույն.

Հոգեբանական ընկալումը գույնի

Գույն - սա այն է, ինչ մենք տեսնում ենք: Գույնը է մեկ եւ նույն բանը մարդու համար եւ կատուների կլինի տարբեր: Քանի որ մենք (մարդկանց) եւ կենդանական օպտիկական համակարգի - ի տեսլականն է տարբերվում: Հետեւաբար, գույն, դա հոգեբանական որակը մեր տեսլականի, որ տեղի է ունենում այն ժամանակ, երբ դիտարկելով օբյեկտների եւ լույսը: Եւ ոչ մի ֆիզիկական սեփականությունը օբյեկտի եւ լույսի: Գույնը `արդյունք փոխազդեցության թեթեւ բաղադրիչների, եւ դեպքի վայր է մեր տեսողական համակարգի.

Ծրագրավորում Համակարգիչ Վիժն է Python օգտագործելով գրադարաններում

Եթե դուք արդեն որոշել է զբաղվել լուրջ ուսումնասիրության համակարգչային vision, պետք է անմիջապես պատրաստել է մի շարք դժվարությունների, այս գիտությունը չէ ամենահեշտ եւ hides մի շարք որոգայթներ. Բայց «Ծրագրավորում Համակարգիչ Վիժն վրա Python« հեղինակությամբ Յան Էրիկ solema մի գիրք, որը նախանշում է բոլոր առավել պարզ լեզուն: Այստեղ Դուք կարող եք ծանոթանալ մեթոդներով ճանաչման տարբեր օբյեկտների 3D, սովորեն աշխատել է ստերեո պատկերով, վիրտուալ իրականության եւ շատ այլ ծրագրեր, համակարգչային տեսլականի: Ի գրքում բավարար օրինակներ Python. Բայց բացատրություններ են ներկայացվում, այսպես ասած, ընդհանրացված, այնպես չէ, որ ծանրաբեռնված չափազանց շատ հետազոտություններ եւ ծանր տվյալները. Work հարմար է ուսանողների համար, Սիրողների, եւ enthusiasts. Բեռնել այս գիրքը եւ ուրիշներին մասին համակարգչային vision (pdf ձեւաչափով) կարող է լինել ցանցում:

Ներկայումս, կան բաց աղբյուր գրադարանը համակարգչային տեսողության ալգորիթմներ եւ պատկերի մշակման եւ թվային ալգորիթմների OpenCV: Այն իրականացվում է ամենաժամանակակից ծրագրավորման լեզուների, բաց աղբյուր. Եթե մենք խոսում ենք համակարգչային vision, Python օգտագործում որպես ծրագրավորման լեզու է, այն ունի նաեւ աջակցությունը գրադարանի, ի լրումն, որ անընդհատ զարգանում է եւ ունի մեծ համայնք:

Ընկերությունը «Մայքրոսոֆթ» տրամադրում է իր ծառայությունները API-կարողացել է պատրաստել նեյրոնային ցանցը աշխատել այն մարդկանց կերպարների: Կա նաեւ հնարավորություն է կիրառել համակարգչային տեսլականը, Python օգտագործում որպես ծրագրավորման լեզու.

Համակարգիչներ, Տեղեկատվական տեխնոլոգիաների

Ժամանակակից համակարգչային vision. Խնդիրները եւ համակարգչային տեսողության տեխնոլոգիայով. Ծրագրավորում Համակարգիչ Վիժն է Python

Որն է համակարգչային vision. Դա հնարավորություն է «տեսնել» ձեր համակարգիչը

Իմաստային միջուկ պատկերը

Հեռավորությունները եւ երկարությունները համակարգչային տեսլականի

Վերլուծություն, օրինակը ճանաչման ուղին ստեղծման վերադաս հետախուզության

Ռոբոտներ կարող է «տեսնել»

Շեմին աշխարհի արհեստական ինտելեկտի

Համակարգչային դեռ չի հասկանում, բայց դա «տեսնում»

Ինտեգրումը համակարգչային տեսողության տարբեր հարթակներում

Չլուծված խնդիր է համակարգչային vision - ի կարողությունը ճանաչել որեւէ տեքստ

Խաղեր, այդ թվում համակարգչային տեսլականը, միջնորդությունը գրավումը

ռոբոտներ են ամենուր

Ժամանակակից տեսախցիկ - սա անալոգային տեսախցիկ Obscura

Հոգեբանական ընկալումը գույնի

Ծրագրավորում Համակարգիչ Վիժն է Python օգտագործելով գրադարաններում

Similar articles

Համակարգիչներ

Համակարգիչներ

Համակարգիչներ

Համակարգիչներ

Համակարգիչներ

Համակարգիչներ

Trending Now

Նորություններ եւ Հասարակություն

Տնային հարմարակեցություն

Նորություններ եւ Հասարակություն

Մոդա

Առողջություն

Սիրած զբաղմունք

Newest

Նորություններ եւ Հասարակություն

Կազմում

Ինտերնետ

Ուտելիք եւ Խմիչք

Տնային հարմարակեցություն

Արվեստ եւ ժամանց