-
1. Data: 2014-03-04 23:27:38
Temat: Konwersja wiki
Od: Andrzej Jarzabek <a...@g...com>
Mam taki problem, że potrzebuję skonwertować markup pewnej wiki na
HTML-owy czy XML-owy format. Zastanawiam się nad doborem sensownej
technologii do tego - wyobrażam sobie to mniej więcej tak, że będę pisać
serię reguł dopasowujących wzorce i budujące DOM - np. jest powiedzmy
reguła mówiąca, że jeśli znajdzie się w tekście sekwencja {{{ i }}}, to
w tym miejscu wstawiam określony element a zawartość dalej przetwarzam
według tych samych reguł i podczepiam pod ten element - ale oczywiście
niekoniecznie, mogą być reguły mówiące, że wewnątrz określonych
znaczników tekst jest przetwarzany według innych zasad, czy też np.
dokonujące zwykłych tekstowych substytucji.
Oczywiście można to wszystko rzeźbić ręcznie na jakiejś Javie czy innej
maszynie Turinga, ale reguł może być trochę, będą na bieżąco dopisywane,
modyfikowane, przestawiane itd., więc się zastanawiam, czy są jakieś
języki, biblioteki, czy inne narzędzia, które ułatwiają taką robotę. Z
miłych ficzerów dobrze by było, gdyby bez nadmiernego dłubania dało się
określać wzorce łapiące w jednej linijce lub w wielu i możliwość
zdefiniowania wzorców przechwytujących zmienną liczbę podelementów (typu
|a|b|c|...).
Dobrze by było jeszcze, gdyby się nadawało do użycia przez prostego
inżyniera. :)
-
2. Data: 2014-03-05 00:06:20
Temat: Re: Konwersja wiki
Od: g...@g...com
W dniu wtorek, 4 marca 2014 23:27:38 UTC+1 użytkownik Andrzej Jarzabek napisał:
[...]
> Oczywiście można to wszystko rzeźbić ręcznie na jakiejś Javie czy innej
> maszynie Turinga, ale reguł może być trochę, będą na bieżąco dopisywane,
> modyfikowane, przestawiane itd., więc się zastanawiam, czy są jakieś
> języki, biblioteki, czy inne narzędzia, które ułatwiają taką robotę.
Nie wiem, czy dobrze rozumiem, ale mój pierwszy strzał byłby taki, że ja bym do tego
użył perla (albo pcre, gdyby była konieczność skorzystania z jakiegoś innego języka).
Robota byłaby prosta zwłaszcza jeżeli dałoby się uniknąć parsowania składni i można
by było operować bezpośrednio na napisach. W CPANie można znaleźć też moduły do
obsługi DOM, choć przyznam, że nigdy się czymś takim nie bawiłem.
W razie czego służę pomocą.
-
3. Data: 2014-03-05 09:28:51
Temat: Re: Konwersja wiki
Od: Piotr Chamera <p...@p...onet.pl>
W dniu 2014-03-04 23:27, Andrzej Jarzabek pisze:
> Mam taki problem, że potrzebuję skonwertować markup pewnej wiki na
> HTML-owy czy XML-owy format. Zastanawiam się nad doborem sensownej
> technologii do tego (...)
Jeśli to było działające wiki, to zapewne istnieją programy
przekształcające ten ,,markup" na ,,jakiś" HTML. Może użyć natywnego
dla tego wiki narzędzia do wygenerowania HTML i ewentualnie potem
przekształcać wynik narzędziami do obróbki HTML i XML (np. XSLT)?
-
4. Data: 2014-03-05 09:53:24
Temat: Re: Konwersja wiki
Od: Maciej Sobczak <s...@g...com>
W dniu wtorek, 4 marca 2014 23:27:38 UTC+1 użytkownik Andrzej Jarzabek napisał:
> Mam taki problem, że potrzebuję skonwertować markup pewnej wiki na
> HTML-owy czy XML-owy format.
Generalnie, serwery wiki do tego służą. Tzn. serwer wiki to taki program, do którego
podłączamy się przez HTTP a on bierze źródło z markupem wiki, konwertuje na HTML i
wysyła klientowi.
A najlepiej nadaje się do tego ten sam serwer wiki, który te dane źródłowe zapisał.
Oczywiście w takim wynikowym HTMLu są jakieś niepotrzebne rzeczy, np. logo albo
footer tego serwera, ale chyba łatwiej to wyciąć, niż konwertować źródło.
--
Maciej Sobczak * http://www.msobczak.com * http://www.inspirel.com
-
5. Data: 2014-03-05 09:58:06
Temat: Re: Konwersja wiki
Od: "Stachu 'Dozzie' K." <d...@g...eat.some.screws.spammer.invalid>
On 2014-03-05, Maciej Sobczak <s...@g...com> wrote:
> W dniu wtorek, 4 marca 2014 23:27:38 UTC+1 użytkownik Andrzej Jarzabek napisał:
>
>> Mam taki problem, że potrzebuję skonwertować markup pewnej wiki na
>> HTML-owy czy XML-owy format.
>
> Generalnie, serwery wiki do tego służą. Tzn. serwer wiki to taki program, do
którego podłączamy się przez HTTP a on bierze źródło z markupem wiki, konwertuje na
HTML i wysyła klientowi.
> A najlepiej nadaje się do tego ten sam serwer wiki, który te dane źródłowe zapisał.
>
> Oczywiście w takim wynikowym HTMLu są jakieś niepotrzebne rzeczy, np. logo albo
footer tego serwera, ale chyba łatwiej to wyciąć, niż konwertować źródło.
A to jeszcze zależy co to za język formatowania, bo do niektórych (ReST,
Markdown, Textile) są samodzielne konwertery.
--
Secunia non olet.
Stanislaw Klekot
-
6. Data: 2014-03-05 23:11:15
Temat: Re: Konwersja wiki
Od: Andrzej Jarzabek <a...@g...com>
On 05/03/2014 08:53, Maciej Sobczak wrote:
> W dniu wtorek, 4 marca 2014 23:27:38 UTC+1 użytkownik Andrzej
> Jarzabek napisał:
>
>> Mam taki problem, że potrzebuję skonwertować markup pewnej wiki na
>> HTML-owy czy XML-owy format.
>
> Generalnie, serwery wiki do tego służą. Tzn. serwer wiki to taki
> program, do którego podłączamy się przez HTTP a on bierze źródło z
> markupem wiki, konwertuje na HTML i wysyła klientowi. A najlepiej
> nadaje się do tego ten sam serwer wiki, który te dane źródłowe
> zapisał.
Ten format musi być dość konkretny, nie dowolny.
> Oczywiście w takim wynikowym HTMLu są jakieś niepotrzebne rzeczy, np.
> logo albo footer tego serwera, ale chyba łatwiej to wyciąć, niż
> konwertować źródło.
Akurat do tego udało mi się nakłonić serwer i wygląda na to, że to
faktycznie dobry trop. Są pewne problemy, których nie mam z markupem,
typu że np. serwer generuje TOC, którego ja nie chcę - nie wiem, czy to
się daw wyłączyć. Oczywiście samo to będzie proste do wycięcia, pytanie
ile jeszcze tego typu niespodzianek będzie. Ale ogólnie racja - łatwiej
będzie konwertować z wyrenderowanego HTML-a.
-
7. Data: 2014-03-05 23:51:00
Temat: Re: Konwersja wiki
Od: Andrzej Jarzabek <a...@g...com>
On 05/03/2014 08:28, Piotr Chamera wrote:
> W dniu 2014-03-04 23:27, Andrzej Jarzabek pisze:
>> Mam taki problem, że potrzebuję skonwertować markup pewnej wiki na
>> HTML-owy czy XML-owy format. Zastanawiam się nad doborem sensownej
>> technologii do tego (...)
>
> Jeśli to było działające wiki, to zapewne istnieją programy
> przekształcające ten ,,markup" na ,,jakiś" HTML. Może użyć natywnego
> dla tego wiki narzędzia do wygenerowania HTML i ewentualnie potem
> przekształcać wynik narzędziami do obróbki HTML i XML (np. XSLT)?
Dzięki wielkie! Co prawda natywne narzędzie jest PHP-owe, więc musiałbym
albo pisać skrypty w PHP (bleh), albo spawać PHP z czymś ludzkim. Ale
wygląda na to, że są alternatywne parsery - różne technologie, różna
wygoda użycia, różne poziomy zgodności - ale można się przyjrzeć.
Wychodzi na to, że mogę też całkiem wygodnie przekonwertować serwerem Wiki.
Dalej spróbuję faktycznie XSLT, nie bawiłem się tym wcześniej, ale first
time for everything itd.
-
8. Data: 2014-03-06 09:43:14
Temat: Re: Konwersja wiki
Od: Maciej Sobczak <s...@g...com>
W dniu środa, 5 marca 2014 23:11:15 UTC+1 użytkownik Andrzej Jarzabek napisał:
> Ale ogólnie racja - łatwiej
> będzie konwertować z wyrenderowanego HTML-a.
Zwłaszcza, że jeśli serwer jest po ludzku napisany, to ten HTML będzie stosunkowo
czysty (ba - w optymalnym przypadku formalnie to będzie XML) a cały niepotrzebny syf
będzie obok, np. w CSS. Dlatego wybranie właściwej treści może być bardzo proste - a
dalej, mając już taki oczyszczony HTML/XML, już jak kto lubi.
Chyba nawet widziałem kiedyś w jakimś serwerze flagę (doklejaną w URLu), która
renderuje prostszą postać strony. Warto takich flag poszukać. Hint: opcja
renderowania na potrzeby drukowania?
--
Maciej Sobczak * http://www.msobczak.com * http://www.inspirel.com
-
9. Data: 2014-03-06 15:10:12
Temat: Re: Konwersja wiki
Od: "tusk, donald tusk" <N...@g...pl>
ale po co Ci to?
(taki proeuropejski żarcik)