-
1. Data: 2019-11-10 10:16:21
Temat: DeepL
Od: Borneq <b...@a...hidden.pl>
No i stało się. Zainstalowałem DeepL lokalnie na komputerze, do tej pory
używałem przez internet. Działa szybciej niż przez internet, nie trzeba
koniecznie połączenie z siecią oraz większa prywatność co ma wadę, że
moje poprawy tłumaczenia nie będą służyły w rozwoju tłumaczenia.
Instalator (oflfline) ma 145 mega , a po zainstalowaniu w
Users\user\AppData\Local ma 490 mega.
Czyli nie gigabajty, bo do tej pory myślałem, że tłumaczenie
statystyczne, zwłaszcza tak dobre jak DeelP będzie za duże by mieć
lokalnie. Ale ma 9 języków, a par jest dwukrotnie więcej niż w
turniejach, bo trzeba w dwóch kierunkach czyli n(n-1), więc dla 9 jest
72. Na każdą parę przypada więc zaledwie 7 mega. Tłumacz Google ma aż
26*4-1 = 103 języki!
Czyli aż 103*102 = 10506? par po 6.8 mega to 71 giga?
Aż się prosi by nie tłumaczyć każdy z każdym ale do jakiegoś języka,
gdyby do angielskiego, tłumaczenie niemiecki-polski było by bardzo złe
gdyby chcieć niemiecki-angielski-polski. Ttrzeba by wprowadzić sztuczny
język ze sztywnymi regułami.
Universal Networking Language (UNL) - oparty o angielski, nie ma tam
problemu z takimi słowami jak zamek<-> zamek, bo z każdym słowem
związane jest wyszczególnienie.
-
2. Data: 2019-11-10 10:26:14
Temat: Re: DeepL
Od: Borneq <b...@a...hidden.pl>
W dniu 10.11.2019 o 10:16, Borneq pisze:
> Tłumacz Google ma aż 26*4-1 = 103 języki!
Ciekawe w jaki sposób zbierany jest materiał do tłumaczenia
statystycznego. Jedna rzecz to tlumaczenia Unii.
Podpisy do filmów to raczej trudno użyć jako "Rosetta Stone", np. test
"cholera, trzeba strzelać!", może być przetłumaczony na "widzę że
zbliżają się kłopoty".
-
3. Data: 2019-11-11 10:53:34
Temat: Re: DeepL
Od: "M.M." <m...@g...com>
On Sunday, November 10, 2019 at 10:26:16 AM UTC+1, Borneq wrote:
> W dniu 10.11.2019 o 10:16, Borneq pisze:
> > Tłumacz Google ma aż 26*4-1 = 103 języki!
> Ciekawe w jaki sposób zbierany jest materiał do tłumaczenia
> statystycznego. Jedna rzecz to tlumaczenia Unii.
> Podpisy do filmów to raczej trudno użyć jako "Rosetta Stone", np. test
> "cholera, trzeba strzelać!", może być przetłumaczony na "widzę że
> zbliżają się kłopoty".
I ciekawe ile czasu jest uczona sieć neuronowa, na jakim sprzęcie, jak są dane
spreparowane, jaki jest podział na dane uczące i testowe, jaką ma architekturę
sieć neuronowa, ile warstw, neuronów, jakie sploty, jakie ograniczenia wag.
Ciekawe czy w ogóle warto próbować na jednym CPU/GPU.
Pozdrawiam.
-
4. Data: 2019-11-18 00:29:22
Temat: Re: DeepL
Od: Borneq <b...@a...hidden.p>
W dniu 11.11.2019 o 10:53, M.M. pisze:
> I ciekawe ile czasu jest uczona sieć neuronowa, na jakim sprzęcie, jak są dane
> spreparowane, jaki jest podział na dane uczące i testowe, jaką ma architekturę
> sieć neuronowa, ile warstw, neuronów, jakie sploty, jakie ograniczenia wag.
> Ciekawe czy w ogóle warto próbować na jednym CPU/GPU.
Podobno na iluś petaflopowym islandzkim superkomputerze
https://antyweb.pl/deepl-tlumacz-online/
-
5. Data: 2019-11-18 01:53:02
Temat: Re: DeepL
Od: "M.M." <m...@g...com>
On Monday, November 18, 2019 at 12:29:24 AM UTC+1, Borneq wrote:
> W dniu 11.11.2019 o 10:53, M.M. pisze:
> > I ciekawe ile czasu jest uczona sieć neuronowa, na jakim sprzęcie, jak są dane
> > spreparowane, jaki jest podział na dane uczące i testowe, jaką ma architekturę
> > sieć neuronowa, ile warstw, neuronów, jakie sploty, jakie ograniczenia wag.
> > Ciekawe czy w ogóle warto próbować na jednym CPU/GPU.
>
> Podobno na iluś petaflopowym islandzkim superkomputerze
> https://antyweb.pl/deepl-tlumacz-online/
Najlepszy komputer na świecie (w teście linpack) ma podobno
https://pl.wikipedia.org/wiki/Summit_(superkomputer)
[
148,6[1] PFLOPS
]
Do translacji używaj 5,1 PFLOPS - czyli ta sama klasa komputerów.
Karty graficzne niby mają po kilka tflops, taki komputer to niby
równoważnik około 1000 GPU. Może na 100 GPU dałoby się już ładnie
pobawić w translację - ale 100 GPU to nadal sporo drogiego sprzętu.
Pozdrawiam
-
6. Data: 2019-11-18 02:05:29
Temat: Re: DeepL
Od: Piotrne <p...@p...onet.pl>
W dniu 2019-11-10 o 10:16, Borneq pisze:
> Aż się prosi by nie tłumaczyć każdy z każdym ale do jakiegoś języka, gdyby do
angielskiego,
> tłumaczenie niemiecki-polski było by bardzo złe gdyby chcieć
niemiecki-angielski-polski. Ttrzeba by
> wprowadzić sztuczny język ze sztywnymi regułami.
Jest jakiś wspólny język, bo tłumaczenie polski-niemiecki
wychodzi źle zarówno w Google, jak i DeepL:
Google:
Idziecie teraz do kina? -> Gehst du jetzt ins kino (co znaczy "idziesz ty teraz do
kina")
DeepL przynajmniej pisze "Kino" wielką literą i stawia znak zapytania:
Idziecie teraz do kina? -> Gehst du jetzt ins Kino?
...ale w obu przypadkach pomylona została liczba mnoga z pojedynczą,
co sugeruje przechodzenie przez język angielski, gdzie "you"
oznacza zarówno "ty", jak i "wy".
Przy jawnym wymuszeniu liczby mnogiej Google dalej sobie nie radzi,
DeepL już tak:
Google:
Wy idziecie. -> Du gehst. (co znaczy "Ty idziesz")
DeepL
Wy idziecie. -> Ihr geht jetzt. ("Wy idziecie teraz")
Sztuczny język byłby dobry, ale skąd wziąć potem dane uczące,
skoro nikt tego języka nie używa i nie ma przykładowych tłumaczeń.
A definiowanie od zera nowego języka ze słownikiem, składnią itp.
to zadanie zbliżone do tworzenia SI, która miałaby tłumaczone
zdania "rozumieć".
P,
-
7. Data: 2019-11-18 08:51:57
Temat: Re: DeepL
Od: "M.M." <m...@g...com>
On Monday, November 18, 2019 at 2:05:31 AM UTC+1, Piotrne wrote:
> W dniu 2019-11-10 o 10:16, Borneq pisze:
>
> > Aż się prosi by nie tłumaczyć każdy z każdym ale do jakiegoś języka, gdyby do
angielskiego,
> > tłumaczenie niemiecki-polski było by bardzo złe gdyby chcieć
niemiecki-angielski-polski. Ttrzeba by
> > wprowadzić sztuczny język ze sztywnymi regułami.
>
> Jest jakiś wspólny język, bo tłumaczenie polski-niemiecki
> wychodzi źle zarówno w Google, jak i DeepL:
>
> Google:
> Idziecie teraz do kina? -> Gehst du jetzt ins kino (co znaczy "idziesz ty teraz
do kina")
>
> DeepL przynajmniej pisze "Kino" wielką literą i stawia znak zapytania:
> Idziecie teraz do kina? -> Gehst du jetzt ins Kino?
>
> ...ale w obu przypadkach pomylona została liczba mnoga z pojedynczą,
> co sugeruje przechodzenie przez język angielski, gdzie "you"
> oznacza zarówno "ty", jak i "wy".
>
> Przy jawnym wymuszeniu liczby mnogiej Google dalej sobie nie radzi,
> DeepL już tak:
>
> Google:
> Wy idziecie. -> Du gehst. (co znaczy "Ty idziesz")
>
> DeepL
> Wy idziecie. -> Ihr geht jetzt. ("Wy idziecie teraz")
>
>
> Sztuczny język byłby dobry, ale skąd wziąć potem dane uczące,
> skoro nikt tego języka nie używa i nie ma przykładowych tłumaczeń.
> A definiowanie od zera nowego języka ze słownikiem, składnią itp.
> to zadanie zbliżone do tworzenia SI, która miałaby tłumaczone
> zdania "rozumieć".
Pierwszy pomysł z brzegu: tłumaczyć wszystko na angielski i potem z
angielskiego na język docelowy. Ale co gdy język docelowy ma jakąś
cechę, a język angielski jej nie ma? Translator chyba by musiał dodawać
zdanie opisowe w języku angielskim...
Pozdrawiam
-
8. Data: 2019-11-18 12:03:48
Temat: Re: DeepL
Od: Roman Tyczka <n...@b...no>
On Mon, 18 Nov 2019 02:05:29 +0100, Piotrne wrote:
>> Aż się prosi by nie tłumaczyć każdy z każdym ale do jakiegoś języka, gdyby do
angielskiego,
>> tłumaczenie niemiecki-polski było by bardzo złe gdyby chcieć
niemiecki-angielski-polski. Ttrzeba by
>> wprowadzić sztuczny język ze sztywnymi regułami.
>
> Jest jakiś wspólny język, bo tłumaczenie polski-niemiecki
> wychodzi źle zarówno w Google, jak i DeepL:
>
> Google:
> Idziecie teraz do kina? -> Gehst du jetzt ins kino (co znaczy "idziesz ty teraz
do kina")
>
> DeepL przynajmniej pisze "Kino" wielką literą i stawia znak zapytania:
> Idziecie teraz do kina? -> Gehst du jetzt ins Kino?
>
> ...ale w obu przypadkach pomylona została liczba mnoga z pojedynczą,
> co sugeruje przechodzenie przez język angielski, gdzie "you"
> oznacza zarówno "ty", jak i "wy".
>
> Przy jawnym wymuszeniu liczby mnogiej Google dalej sobie nie radzi,
> DeepL już tak:
>
> Google:
> Wy idziecie. -> Du gehst. (co znaczy "Ty idziesz")
>
> DeepL
> Wy idziecie. -> Ihr geht jetzt. ("Wy idziecie teraz")
>
>
> Sztuczny język byłby dobry, ale skąd wziąć potem dane uczące,
> skoro nikt tego języka nie używa i nie ma przykładowych tłumaczeń.
> A definiowanie od zera nowego języka ze słownikiem, składnią itp.
> to zadanie zbliżone do tworzenia SI, która miałaby tłumaczone
> zdania "rozumieć".
Wymyślono Esperanto.
--
pozdrawiam
Roman Tyczka
-
9. Data: 2019-11-18 15:30:25
Temat: Re: DeepL
Od: Borneq <b...@a...hidden.p>
W dniu 18.11.2019 o 08:51, M.M. pisze:
> Pierwszy pomysł z brzegu: tłumaczyć wszystko na angielski i potem z
> angielskiego na język docelowy. Ale co gdy język docelowy ma jakąś
> cechę, a język angielski jej nie ma? Translator chyba by musiał dodawać
> zdanie opisowe w języku angielskim...
Angielski i Esperanto się nie nadają. Jest coś takiego jak Universal
Networking Language (UNL) ale brakuje zasobów do nauki.
-
10. Data: 2019-11-18 15:38:02
Temat: Re: DeepL
Od: Borneq <b...@a...hidden.p>
W dniu 10.11.2019 o 10:16, Borneq pisze:
> No i stało się. Zainstalowałem DeepL lokalnie na komputerze, do tej pory
> używałem przez internet. Działa szybciej niż przez internet, nie trzeba
z pdf z https://github.com/lmthang/thesis
przykład gdzie nie ma słownika tylko korpus równolegly
Chodzi o to, jakie maksymalne informacje można wydobyć z korpusa.
parallel corpus
She loves cats = Elle aime les chats
She loves him = Elle l'aime
He adores cute cats = Il adore les chats mignons
He has a cat = Il a un chat
pytanie: jak przetłumaczyć na podstawie tych 4 zdań "She loves cute cats"?
ja dochodzę do wniosku że
Elle aime les chats mignons
deepL: Elle adore les chats mignons - słuszniej, ale nie wynika to z
tych 4 zdań
można się dowiedzieć że
she = elle
loves = aime (cats)|l'aime(him) przy czym te słowa są zadziwiająco
podobne, czyli nie inne tylko inna forma
w rzeczywistości l'aime jest dużo mocniejsze (lubi-kocha) a nie inna forma
cats = les chats //nawet podobne ale nie trzeba się tym sugerować
him = albo znika w tym zdaniu, stając się domyślny albo staje się
przedrostkiem - w rzeczywistości jeśli obiektem jest "on", wtedy się
opuszcza
he = Il
adores = adore
cute = mignons + zamiana miejscami słów we frazie
has - a
a cat = un cat, tylko skąd wiedzieć że to nie "a" zostało przetłumaczone
na "a"?? - potrzebne są albo
wstępne informacje językowe albo więcej zdań w korpusie
Gdyby zapytać się o : He has a cat -> Elle a un chat
można stwierdzić nawet bez wiedzy o tym czy "a" to "has" czy "a" to "a"
Tylko należy zauważyć że te zdania są bardzo krótkie i dość łatwo można
je dopasować