Konwersja tekstów ze starych programów
Rozpoczęty przez
Trilian
, 26 paź 2007 10:14
2 odpowiedzi w tym temacie
#1
Napisano 26 października 2007 - 10:14
Szanowni Makowcy!
Czy istnieje jakiś prostszy sposób na poprawne wyświetlenie i przekonwertowanie znaków diakrytycznych (wszelkie ogonki i ptaszki) ze starych programów na nowe? Czyli konwersje Roman i Cyrilic na Unicode. Mam tu na myśli dokumenty Quark (z wersji 4.04 do wer. 7.3), FreeHand (8, MX do Illustratora CS3).
Dotychczas robiłem to tak:
Na starym kompie (G3/400) otwierało się danego pacjenta pod stosownym starym programem i "wydłubywało" się tekst do pliku (for egzampel: ASCII.txt) następnie otwierało się przez konwersję tego samego pacjenta pod właściwym nowym programem i... zastępowało się teksty z ASCII przekonwertowanego w TextEdit na unicode. I to w miare działa. No ale jest to uciążliwe i zabiera dużo czasu i... miejsca, bo stary komp zagraca przestrzeń życiową. Szy szanowni forumowicze przetrenowali inne sposoby radzenia sobie z ww. problemem?
Dodam jeszcze, że mam do konwertowania przy większości plików z 8 językami za jednym razem (tj. GB, D, F, NL, E, I, PL i RUS - problematyczne są zwłaszcza PL, RUS, F, NL, E, I czyli prawie wszystkie). Czekam na wieści...
#2
Napisano 26 października 2007 - 10:43
O sensownej konwersji wielu języków naraz możesz zapomnieć. Przed-unicode'owe kodowania miały to do siebie, że bazowały na tym samym zakresie kodów znaków i ostateczna definicja znaku była uzupełniana przez informację o kodowaniu (czy to jest Western, CE, Baltic...). Jeśli więc wrzucisz to wszystko do jednego worka (w sensie jednego pliku), to żaden konwerter nie zgadnie jaki faktycznie powinien być wyjściowy kod Unicode.
#3
Napisano 26 października 2007 - 11:01
A może to pomoże?
http://lists.finkpro...nwert?rel_id=11
Przykład użycia: konwert cp1250-uft8 plik_cp1250 > plik_unicode
http://lists.finkpro...nwert?rel_id=11
Przykład użycia: konwert cp1250-uft8 plik_cp1250 > plik_unicode
Użytkownicy przeglądający ten temat: 1
0 użytkowników, 1 gości, 0 anonimowych