eGospodarka.pl
eGospodarka.pl poleca

eGospodarka.plGrupypl.comp.programmingPodpis cyfrowy większej ilości podmiotówRe: Podpis cyfrowy większej ilości podmiotów
  • X-Received: by 10.49.27.233 with SMTP id w9mr885933qeg.23.1366233557692; Wed, 17 Apr
    2013 14:19:17 -0700 (PDT)
    X-Received: by 10.49.27.233 with SMTP id w9mr885933qeg.23.1366233557692; Wed, 17 Apr
    2013 14:19:17 -0700 (PDT)
    Path: news-archive.icm.edu.pl!agh.edu.pl!news.agh.edu.pl!newsfeed2.atman.pl!newsfeed.
    atman.pl!goblin3!goblin.stu.neva.ru!news.ripco.com!news.glorb.com!ca1no973535qa
    b.0!news-out.google.com!ef9ni1990qab.0!nntp.google.com!ca1no973528qab.0!postnew
    s.google.com!glegroupsg2000goo.googlegroups.com!not-for-mail
    Newsgroups: pl.comp.programming
    Date: Wed, 17 Apr 2013 14:19:17 -0700 (PDT)
    In-Reply-To: <kkmvov$hu3$3@news.task.gda.pl>
    Complaints-To: g...@g...com
    Injection-Info: glegroupsg2000goo.googlegroups.com; posting-host=46.134.12.184;
    posting-account=Sb6m8goAAABbWsBL7gouk3bfLsuxwMgN
    NNTP-Posting-Host: 46.134.12.184
    References: <kkdqot$5rl$1@node2.news.atman.pl> <kkfd89$o9b$1@news.task.gda.pl>
    <0...@g...com>
    <kkh42k$81t$1@news.task.gda.pl>
    <b...@g...com>
    <kkhr56$a62$1@news.task.gda.pl>
    <3...@g...com>
    <kkkjpe$b54$1@news.task.gda.pl>
    <8...@g...com>
    <4...@g...com>
    <c...@g...com>
    <6...@g...com>
    <1...@g...com>
    <a...@g...com>
    <0...@g...com>
    <kkmb61$qln$2@news.task.gda.pl> <kkmbce$qln$3@news.task.gda.pl>
    <f...@g...com>
    <kkmh2f$qln$5@news.task.gda.pl>
    <9...@g...com>
    <f...@g...com>
    <kkmvov$hu3$3@news.task.gda.pl>
    User-Agent: G2/1.0
    MIME-Version: 1.0
    Message-ID: <c...@g...com>
    Subject: Re: Podpis cyfrowy większej ilości podmiotów
    From: firr kenobi <p...@g...com>
    Injection-Date: Wed, 17 Apr 2013 21:19:17 +0000
    Content-Type: text/plain; charset=ISO-8859-2
    Content-Transfer-Encoding: quoted-printable
    Xref: news-archive.icm.edu.pl pl.comp.programming:202632
    [ ukryj nagłówki ]

    W dniu środa, 17 kwietnia 2013 22:13:19 UTC+2 użytkownik Edek napisał:
    > Dnia Wed, 17 Apr 2013 10:53:49 -0700 po głębokim namyśle firr kenobi
    >
    > rzekł:
    >
    >
    >
    > > W dniu środa, 17 kwietnia 2013 19:42:11 UTC+2 użytkownik M.M. napisał:
    >
    > >> On Wednesday, April 17, 2013 6:02:23 PM UTC+2, Edek wrote:
    >
    > >>
    >
    > >> [...]
    >
    > >>
    >
    > >> > Dalej mi się teraz już nie chce... firr, zapodaj coś do testu.
    >
    > >>
    >
    > >> > PS: obie kompilowane tak
    >
    > >>
    >
    > >> > gcc -O3 -fwhole-program -march=native main.cpp -o mb
    >
    > >>
    >
    > >> Zadanie jest dobre. Jest dostatecznie proste żeby się pobawić
    >
    > >>
    >
    > >> przy okazji dyskusji na grupie i dość skomplikowane aby dało
    >
    > >>
    >
    > >> się pobawić w optymalizację.
    >
    > >>
    >
    > >>
    >
    > > dla mnie nieco dziaczne te testy bo co to ma mierzyc - ew chyba ogolna
    >
    > > wydajnosc algorytmu (tutaj wychodzi 1.4 miliarda iteracji na pare sekund
    >
    > > czyli wydajnosc podobna do mojej optymalizowanej wersji na prawie 10
    >
    > > letnim p4)
    >
    >
    >
    > O ile dobrze pamiętam, ty miałeś powyżej 2 GFLOPA, to nie jest 1.4 mld
    >
    > iteracji. Raczej jakieś 90mln.
    >

    pozniej poprawilem do 3 GFlopa

    1.4 mld = 14 GFloatow (na 4 sekundy) = 3.5 GFloata na sekunde

    zgadza sie - wzrosło o .5 GFloata
    z jakiegos powodu, moze dluzsze itereacje kreca sie troche szybciej albo wyrzucenie
    setpixeli
    troche przyspieszylo reszte


    co do tego kodu

    vmulsd %xmm4, %xmm4, %xmm7
    // re * re -> xmm7
    vmovapd %xmm4, %xmm6
    vmulsd %xmm3, %xmm3, %xmm5
    //im*im -> xmm5
    vaddsd %xmm5, %xmm7, %xmm4
    // re*re+im*im -> xmm4
    vucomisd %xmm0, %xmm4
    // re*re+im*im > 4 ?
    ja .L4

    // itd

    .L6:
    addl $1, %eax
    vsubsd %xmm5, %xmm7, %xmm4
    vcvtsi2sd %eax, %xmm5, %xmm5
    vaddsd %xmm6, %xmm6, %xmm6
    vaddsd %xmm1, %xmm4, %xmm4
    vmulsd %xmm3, %xmm6, %xmm3
    vaddsd %xmm2, %xmm3, %xmm3
    vucomisd %xmm5, %xmm0
    ja .L7

    to jest nowoczesny kod kod na avx
    ale skalarny na doublach, reczne
    przepisanie tego powinno przyspieszyc pewnie prawie 8 razy

Podziel się

Poleć ten post znajomemu poleć

Wydrukuj ten post drukuj


Następne wpisy z tego wątku

Najnowsze wątki z tej grupy


Najnowsze wątki

Szukaj w grupach

Eksperci egospodarka.pl

1 1 1

Wpisz nazwę miasta, dla którego chcesz znaleźć jednostkę ZUS.

Wzory dokumentów

Bezpłatne wzory dokumentów i formularzy.
Wyszukaj i pobierz za darmo: