-
Data: 2013-11-02 17:52:54
Temat: Re: Sieci neuronowe a OCR [cross]
Od: Piotrne <p...@p...onet.pl> szukaj wiadomości tego autora
[ pokaż wszystkie nagłówki ]W dniu 2013-11-01 13:55, Borneq pisze:
>
> gdy mamy tysiące wymiarów, jest to dla człowieka
> zupełnie nieczytelne. I to chodziło gdy pisałem
> że mają działać same a nie wiadomo jak działają.
>
Bez wstępnego przetworzenia danych raczej będzie trudno uzyskać
efekty, o których piszesz, tj. np. odróżnianie stary / młody
na podstawie bezpośrednio podawanej na wejście NN (lub SVM)
bitmapy z jasnościami pikseli. To podobne zadanie
do nauczenia sieci NN rozpoznawania, czy wiersz jest
smutny czy wesoły - na podstawie pliku GIF z zeskanowanym
wydrukiem wiersza (podając na wejście wszystkie bity z pliku GIF).
Rozpoznawanie twarzy poprzedzane jest zwykle wykryciem twarzy
w całym obrazie, normalizacją: dwuwymiarową (obrotem do "pionu",
skalowaniem i wykadrowaniem twarzy według przyjętych założeń)
i jeśli uda się zaimplementować, trójwymiarową - likwidującą efekty
obrotów, perspektywy itp. Przy okazji może udać się korekcja
oświetlenia twarzy. Następnie realizuje się etap wyznaczania cech
- wektora liczb, zwykle zawierającego ich znacznie mniej, niż jest
pikseli na obrazie. Dopiero ten wektor jest podawany na wejście
algorytmu klasyfikującego.
Podejście całkowicie ogólne (jasności pikseli -> NN -> imię i nazwisko)
jest teoretycznie możliwe, ale praktycznie tylko wtedy, kiedy dane
będą skrajnie uproszczone.
P.
Następne wpisy z tego wątku
- 02.11.13 19:25 Borneq
- 03.11.13 00:54 A.L.
- 03.11.13 12:37 Borneq
- 03.11.13 20:24 A.L.
- 05.11.13 09:20 Andrzej Jarzabek
- 08.11.13 12:41 Roman W
- 08.11.13 20:01 A.L.
- 13.02.14 13:10 Borneq
Najnowsze wątki z tej grupy
- "Wuj dobra rada" z KDAB rozważa: Choosing the Right Programming Language for Your Embedded Linux Device
- Nowa ustawa o ochronie praw autorskich - opis problemu i szkic ustawy
- Alg. kompresji LZW
- Popr. 14. Nauka i Praca Programisty C++ w III Rzeczy (pospolitej)
- Arch. Prog. Nieuprzywilejowanych w pełnej wer. na nowej s. WWW energokod.pl
- 7. Raport Totaliztyczny: Sprawa Qt Group wer. 424
- TCL - problem z escape ostatniego \ w nawiasach {}
- Nauka i Praca Programisty C++ w III Rzeczy (pospolitej)
- testy-wyd-sort - Podsumowanie
- Tworzenie Programów Nieuprzywilejowanych Opartych Na Wtyczkach
- Do czego nadaje się QDockWidget z bibl. Qt?
- Bibl. Qt jest sztucznie ograniczona - jest nieprzydatna do celów komercyjnych
- Co sciaga kretynow
- AEiC 2024 - Ada-Europe conference - Deadlines Approaching
- Jakie są dobre zasady programowania programów opartych na wtyczkach?
Najnowsze wątki
- 2025-03-27 PKW JUŻ odrzuciła 9/53 kandydatów na prezydenta ale może JESZCZE nie mamy Drugiej Rumuni z TEGO powodu :-)
- 2025-03-27 Warszawa => Generative AI Engineer <=
- 2025-03-27 Warszawa => Asystent Sprzedaży <=
- 2025-03-27 Warszawa => Customer Service with Spanish + translation <=
- 2025-03-27 Gdańsk => PHP Developer <=
- 2025-03-27 Warszawa => C Programmer <=
- 2025-03-27 Czy prawo mówi o prawie do udziału w przesłuchaniu pełnomocnika czy pełnomocników?
- 2025-03-27 Warszawa => Programista C <=
- 2025-03-27 Gerald B. zeznawał z DWOMA pełnomocnikami z najwyższej półki
- 2025-03-27 Yanosik
- 2025-03-26 Jaka wełna na poddasze?
- 2025-03-26 Ostrów Świętokrzy => Node.js / Fullstack Developer <=
- 2025-03-26 Kraków => DevOps Engineer (Junior or Regular level) <=
- 2025-03-26 Kraków => Spedytor Międzynarodowy <=
- 2025-03-26 Czujnik dławienia termicznego procesora - który?