eGospodarka.pl
eGospodarka.pl poleca

eGospodarka.plGrupypl.comp.programming › Unicode powyżej BMP
Ilość wypowiedzi w tym wątku: 13

  • 11. Data: 2011-05-25 20:49:42
    Temat: Re: Unicode powyżej BMP
    Od: Zbigniew Malec <a...@i...invalid>

    On Wed, 25 May 2011 01:13:02 +0200, Wiktor S. wrote:

    > nie n-ty bajt, tylko n-te słowo. czyli pół znaku czasami. i tak działa chyba
    > większość implementacji stringów o 16-bitowych znakach.

    Ok, może być słowo. W każdym razie, jeżeli [] działa w danym api źle
    (operuje na słowach, a nie na codepoint), to i pos i find też będzie
    działało źle. Przynajmniej o ile api jest spójne. I o to mi chodzi z tą
    niespójnością.

    --
    Pozdrawiam
    Zbyszek Malec


  • 12. Data: 2011-05-26 05:26:45
    Temat: Re: Unicode powyżej BMP
    Od: "Wiktor S." <w...@M...fm>

    >> Ale nie jestem pewien jak działa funkcja String.codePointAt
    >> czy jeśli mam _dwa_słowa_na_hieroglif, litera A
    >> to dla zera zwróci hieroglif natomiast A zwróci dla trójki zamiast
    >> dla dwójki?
    >
    > Nie bardzo rozumiem słowo "hieroglif"

    zapewne w dosłownym znaczeniu, np. U+131A7 EGYPTIAN HIEROGLYPH L004

    > Code point to jest numerek znaczka w unicode. Jeżeli twój napis
    > składa się z dwóch charów, bazy i surogatu, to przeczytasz dwa chary,
    > ale jeden codepoint.

    i kto tu mówił o spójności...

    jak więc proponujesz by POWINNA wyglądać obsługa znaków o 17- i więcej
    bitowych codepointach?

    --
    Azarien


  • 13. Data: 2011-05-26 07:18:23
    Temat: Re: Unicode powyżej BMP
    Od: Zbigniew Malec <a...@i...invalid>

    On Thu, 26 May 2011 07:26:45 +0200, Wiktor S. wrote:

    > zapewne w dosłownym znaczeniu, np. U+131A7 EGYPTIAN HIEROGLYPH L004

    Ok, najciemniej pod latarnią :]

    >> Code point to jest numerek znaczka w unicode. Jeżeli twój napis
    >> składa się z dwóch charów, bazy i surogatu, to przeczytasz dwa chary,
    >> ale jeden codepoint.
    >
    > i kto tu mówił o spójności...

    Spójność tu jest taka, że w String jest api do operowania na znakach i one
    zawsze daje wyniki w znakach oraz jest api do operowania na code point i
    ono zawsze daje wyniki w codepoint. Mamy tu do czynienia z dwoma api i one
    wewnętrznie są spójne (w sensie albo zawsze char albo zawsze codepoint).

    > jak więc proponujesz by POWINNA wyglądać obsługa znaków o 17- i więcej
    > bitowych codepointach?

    Ale w ogólności, czy jak to jest zrobione w javie?

    --
    Pozdrawiam
    Zbyszek Malec

strony : 1 . [ 2 ]


Szukaj w grupach

Szukaj w grupach

Eksperci egospodarka.pl

1 1 1

Wpisz nazwę miasta, dla którego chcesz znaleźć jednostkę ZUS.

Wzory dokumentów

Bezpłatne wzory dokumentów i formularzy.
Wyszukaj i pobierz za darmo: