-
Data: 2013-11-02 17:52:54
Temat: Re: Sieci neuronowe a OCR [cross]
Od: Piotrne <p...@p...onet.pl> szukaj wiadomości tego autora
[ pokaż wszystkie nagłówki ]W dniu 2013-11-01 13:55, Borneq pisze:
>
> gdy mamy tysiące wymiarów, jest to dla człowieka
> zupełnie nieczytelne. I to chodziło gdy pisałem
> że mają działać same a nie wiadomo jak działają.
>
Bez wstępnego przetworzenia danych raczej będzie trudno uzyskać
efekty, o których piszesz, tj. np. odróżnianie stary / młody
na podstawie bezpośrednio podawanej na wejście NN (lub SVM)
bitmapy z jasnościami pikseli. To podobne zadanie
do nauczenia sieci NN rozpoznawania, czy wiersz jest
smutny czy wesoły - na podstawie pliku GIF z zeskanowanym
wydrukiem wiersza (podając na wejście wszystkie bity z pliku GIF).
Rozpoznawanie twarzy poprzedzane jest zwykle wykryciem twarzy
w całym obrazie, normalizacją: dwuwymiarową (obrotem do "pionu",
skalowaniem i wykadrowaniem twarzy według przyjętych założeń)
i jeśli uda się zaimplementować, trójwymiarową - likwidującą efekty
obrotów, perspektywy itp. Przy okazji może udać się korekcja
oświetlenia twarzy. Następnie realizuje się etap wyznaczania cech
- wektora liczb, zwykle zawierającego ich znacznie mniej, niż jest
pikseli na obrazie. Dopiero ten wektor jest podawany na wejście
algorytmu klasyfikującego.
Podejście całkowicie ogólne (jasności pikseli -> NN -> imię i nazwisko)
jest teoretycznie możliwe, ale praktycznie tylko wtedy, kiedy dane
będą skrajnie uproszczone.
P.
Następne wpisy z tego wątku
- 02.11.13 19:25 Borneq
- 03.11.13 00:54 A.L.
- 03.11.13 12:37 Borneq
- 03.11.13 20:24 A.L.
- 05.11.13 09:20 Andrzej Jarzabek
- 08.11.13 12:41 Roman W
- 08.11.13 20:01 A.L.
- 13.02.14 13:10 Borneq
Najnowsze wątki z tej grupy
- 7. Raport Totaliztyczny: Sprawa Qt Group wer. 424
- TCL - problem z escape ostatniego \ w nawiasach {}
- Nauka i Praca Programisty C++ w III Rzeczy (pospolitej)
- testy-wyd-sort - Podsumowanie
- Tworzenie Programów Nieuprzywilejowanych Opartych Na Wtyczkach
- Do czego nadaje się QDockWidget z bibl. Qt?
- Bibl. Qt jest sztucznie ograniczona - jest nieprzydatna do celów komercyjnych
- Co sciaga kretynow
- AEiC 2024 - Ada-Europe conference - Deadlines Approaching
- Jakie są dobre zasady programowania programów opartych na wtyczkach?
- sprawdzanie słów kluczowych dot. zła
- Re: W czym sie teraz pisze programy??
- Re: (PDF) Surgical Pathology of Non-neoplastic Gastrointestinal Diseases by Lizhi Zhang
- CfC 28th Ada-Europe Int. Conf. Reliable Software Technologies
- Młodzi programiści i tajna policja
Najnowsze wątki
- 2024-12-03 Tymoteusz Sz.
- 2024-12-03 Re: Prezydent ułaskawia: Prezydent USA Biden (D) ułaskawia syna własnego
- 2024-12-03 Re: Tani dodatkowy sim do smartwacha
- 2024-12-03 Wróblewo => Analityk finansowy <=
- 2024-12-03 Praktyczny test GPS...
- 2024-12-02 Tak się sprzedają elektryczne woldzwageny ;-)
- 2024-12-02 Akumulator do Hyundai
- 2024-12-02 Olsztyn => Sales Specialist <=
- 2024-12-02 Poznań => Technical Artist <=
- 2024-12-02 Bieruń => Regionalny Kierownik Sprzedaży (OZE) <=
- 2024-12-02 Kraków => Business Development Manager - Dział Sieci i Bezpieczeńst
- 2024-12-02 Chrzanów => Team Lead / Tribe Lead FrontEnd <=
- 2024-12-02 Białystok => Delphi Programmer <=
- 2024-12-02 Poznań => Dyspozytor Międzynarodowy <=
- 2024-12-02 Szczecin => Key Account Manager (ERP) <=