eGospodarka.pl
eGospodarka.pl poleca

eGospodarka.plGrupypl.comp.programmingelementarne pytania z pythonaRe: elementarne pytania z pythona
  • Path: news-archive.icm.edu.pl!news.icm.edu.pl!fu-berlin.de!news.uzoreto.com!feeder1.f
    eed.usenet.farm!feed.usenet.farm!eternal-september.org!feeder.eternal-september
    .org!reader01.eternal-september.org!.POSTED!not-for-mail
    From: Piotr Chamera <p...@p...onet.pl>
    Newsgroups: pl.comp.programming
    Subject: Re: elementarne pytania z pythona
    Date: Sat, 11 Apr 2020 12:59:19 +0200
    Organization: A noiseless patient Spider
    Lines: 72
    Message-ID: <r6s7u8$9ac$1@dont-email.me>
    References: <6...@g...com>
    <r6qalc$b4t$1@dont-email.me>
    <3...@g...com>
    <b...@g...com>
    <r6s2u1$a7q$1@dont-email.me>
    <f...@g...com>
    <5...@g...com>
    Mime-Version: 1.0
    Content-Type: text/plain; charset=utf-8; format=flowed
    Content-Transfer-Encoding: 8bit
    Injection-Date: Sat, 11 Apr 2020 10:59:20 -0000 (UTC)
    Injection-Info: reader02.eternal-september.org;
    posting-host="d8de2f4b772302e357395fe23ff3526a"; logging-data="9548";
    mail-complaints-to="a...@e...org";
    posting-account="U2FsdGVkX19VHy6fGwbiajk+SGGmu6QJ"
    User-Agent: Mozilla/5.0 (Windows NT 6.3; WOW64; rv:68.0) Gecko/20100101
    Thunderbird/68.6.0
    Cancel-Lock: sha1:zODUCOGMfUSFDD8t5q8w2y03x8I=
    In-Reply-To: <5...@g...com>
    Content-Language: pl
    Xref: news-archive.icm.edu.pl pl.comp.programming:214833
    [ ukryj nagłówki ]

    W dniu 2020-04-11 o 12:06, fir pisze:
    > jeszcze jedno pytanke, jesli mozn, ulatwiloby mi sprawe
    >
    > to ogniem i mieczem przkonwertowalem sobie z epub na txt jakism konwerterem
    > zachowal unicode itd chyab wszystko jest ok poza faktem ze tam gdzie powinno byc
    jedno newline 0x0d 0x0a pwoiedzmy jest za kazdym razem 0x0a 0x0a 0x0a (trzy 0A)
    > i wiekszosc edytorow traktuje to jako 3 newliny
    >
    > jak sprawdzc czy
    > ogniem_i_mieczem_text[m] jest pojedyncza linia z 0x0a? ew jak napisac prsty
    konwerter w pythonie ktory by polknal plik i zamianil kazde 3 0x0A na jedno 0xA

    To już moja ostatnia odpowiedź dzisiaj.


    Konwersja całości, to najprościej chyba jakoś tak:

    s jest twoim źródłowym tekstem

    >>> s.replace(u"\u000a\u000a\u000a", u"\u000a")

    albo

    >>> s.replace(u"\n\n\n", u"\n")

    ale nie wiem, czy interpretacja \n nie zależy od systemu

    uwaga: to zwraca nowego stringa, nie podmienia w oryginalnym.




    A sprawdzania można zrobić np. tak:

    przykładowy wieloliniowy tekst:

    s = u"""ahjklsl


    ajkshgjkgh


    hsajhkjhskj


    hnajkhjhjl"""


    poniższe sprawdza czy podany tekst dzieli się na określone 3 części

    >>> m = re.match(u"(.*?)(\u000a+)(.*)", s, flags=re.DOTALL)

    (.*?) ta grupa dopasowuje dowolny tekst w sposób niezachłanny
    (\u000a+) ta grupa dopasowuje jeden lub więcej znaków końca linii
    (.*) tu wpychamy całą resztę tekstu

    i teraz możemy sprawdzić

    jaki był pierwszy wiersz

    >>> m.group(1)
    u'ahjklsl'

    ile znaków końca linii było po pierwszym wierszu
    >>> len(m.group(2))
    3
    >>> m.group(2)
    u'\n\n\n'

    czy w tekście było coś jeszcze
    >>> len(m.group(3))
    37
    >>> m.group(3)
    u'ajkshgjkgh\n\n\nhsajhkjhskj\n\n\nhnajkhjhjl'

Podziel się

Poleć ten post znajomemu poleć

Wydrukuj ten post drukuj


Następne wpisy z tego wątku

  • 11.04.20 13:04 fir

Najnowsze wątki z tej grupy


Najnowsze wątki

Szukaj w grupach

Eksperci egospodarka.pl

1 1 1

Wpisz nazwę miasta, dla którego chcesz znaleźć jednostkę ZUS.

Wzory dokumentów

Bezpłatne wzory dokumentów i formularzy.
Wyszukaj i pobierz za darmo: