-
Data: 2013-11-02 17:52:54
Temat: Re: Sieci neuronowe a OCR [cross]
Od: Piotrne <p...@p...onet.pl> szukaj wiadomości tego autora
[ pokaż wszystkie nagłówki ]W dniu 2013-11-01 13:55, Borneq pisze:
>
> gdy mamy tysiące wymiarów, jest to dla człowieka
> zupełnie nieczytelne. I to chodziło gdy pisałem
> że mają działać same a nie wiadomo jak działają.
>
Bez wstępnego przetworzenia danych raczej będzie trudno uzyskać
efekty, o których piszesz, tj. np. odróżnianie stary / młody
na podstawie bezpośrednio podawanej na wejście NN (lub SVM)
bitmapy z jasnościami pikseli. To podobne zadanie
do nauczenia sieci NN rozpoznawania, czy wiersz jest
smutny czy wesoły - na podstawie pliku GIF z zeskanowanym
wydrukiem wiersza (podając na wejście wszystkie bity z pliku GIF).
Rozpoznawanie twarzy poprzedzane jest zwykle wykryciem twarzy
w całym obrazie, normalizacją: dwuwymiarową (obrotem do "pionu",
skalowaniem i wykadrowaniem twarzy według przyjętych założeń)
i jeśli uda się zaimplementować, trójwymiarową - likwidującą efekty
obrotów, perspektywy itp. Przy okazji może udać się korekcja
oświetlenia twarzy. Następnie realizuje się etap wyznaczania cech
- wektora liczb, zwykle zawierającego ich znacznie mniej, niż jest
pikseli na obrazie. Dopiero ten wektor jest podawany na wejście
algorytmu klasyfikującego.
Podejście całkowicie ogólne (jasności pikseli -> NN -> imię i nazwisko)
jest teoretycznie możliwe, ale praktycznie tylko wtedy, kiedy dane
będą skrajnie uproszczone.
P.
Następne wpisy z tego wątku
- 02.11.13 19:25 Borneq
- 03.11.13 00:54 A.L.
- 03.11.13 12:37 Borneq
- 03.11.13 20:24 A.L.
- 05.11.13 09:20 Andrzej Jarzabek
- 08.11.13 12:41 Roman W
- 08.11.13 20:01 A.L.
- 13.02.14 13:10 Borneq
Najnowsze wątki z tej grupy
- Alg. kompresji LZW
- Popr. 14. Nauka i Praca Programisty C++ w III Rzeczy (pospolitej)
- Arch. Prog. Nieuprzywilejowanych w pełnej wer. na nowej s. WWW energokod.pl
- 7. Raport Totaliztyczny: Sprawa Qt Group wer. 424
- TCL - problem z escape ostatniego \ w nawiasach {}
- Nauka i Praca Programisty C++ w III Rzeczy (pospolitej)
- testy-wyd-sort - Podsumowanie
- Tworzenie Programów Nieuprzywilejowanych Opartych Na Wtyczkach
- Do czego nadaje się QDockWidget z bibl. Qt?
- Bibl. Qt jest sztucznie ograniczona - jest nieprzydatna do celów komercyjnych
- Co sciaga kretynow
- AEiC 2024 - Ada-Europe conference - Deadlines Approaching
- Jakie są dobre zasady programowania programów opartych na wtyczkach?
- sprawdzanie słów kluczowych dot. zła
- Re: W czym sie teraz pisze programy??
Najnowsze wątki
- 2025-02-21 Warszawa => Key Account Manager IT <=
- 2025-02-21 Warszawa => Data Engineer (Tech Lead) <=
- 2025-02-21 Aliexpress zaczął oszukiwać na bezczelnego.
- 2025-02-21 Warszawa => System Architect (Java background) <=
- 2025-02-21 Kula w łeb
- 2025-02-21 Warszawa => System Architect (background deweloperski w Java) <=
- 2025-02-21 Warszawa => Solution Architect (Java background) <=
- 2025-02-21 Lublin => JavaScript / Node / Fullstack Developer <=
- 2025-02-21 Pawel S
- 2025-02-21 Warszawa => Key Account Manager (Usługi HR) <=
- 2025-02-21 Katowice => Senior Field Sales (system ERP) <=
- 2025-02-21 Chrzanów => Programista NodeJS <=
- 2025-02-21 Wrocław => Konsultant wdrożeniowy Comarch XL/Optima (Księgowość i
- 2025-02-21 Warszawa => Administrator Systemów Windows IT <=
- 2025-02-21 Wrocław => Specjalista ds. Sprzedaży (transport drogowy) <=