RSS

Problemy z kodowaniem znaków przy przenoszeniu z PDF do OpenOffica pod Linuksem

27 Maj

Na studia na zaliczenie musieliśmy przygotować godzinne wystąpienie na temat Parlamentu Europejskiego, wiadomo cały semestr na to był ale najlepiej się wszystko robi w dzień wystąpienia o godzinie 11 gdzie na 15 już trzeba mieć gotowe.;] CRTL+C CRTL+V poszło w ruch ale przy kopiowaniu zawartości PDFów zaczęły się problemy podczas wklejania do OpenOffica, brakowało wszystkich polskich znaków… Ręcznie zmienianie znaków zajęło więcej czasu niż samo sklejanie wycinków. Jeżeli macie podobny problem to napisałem mały skrypt który zamienia wszystkie „krzaki” na polskie literki. Skrypt wykorzystuje polecenie sed i dostępny jest tutaj.

Kod skryptu :
#!/bin/bash
sed -e 's/3/ł/g' $1 > 1.tmp
sed -e 's/¿/ż/g' 1.tmp > 2.tmp
sed -e 's/ê/ę/g' 2.tmp > 1.tmp
sed -e 's/œ/ś/g' 1.tmp > 2.tmp
sed -e 's/æ/ć/g' 2.tmp > 1.tmp
sed -e 's/ó/ó/g' 1.tmp > 2.tmp
sed -e 's/1/ą/g' 2.tmp > $1.po.zmianie.txt
rm -rf 1.tmp 2.tmp

Jak używać :
1. Ściągamy skrypt
2. Nadajemy mu prawa wykonywania : chmod +x zmien
3. Odpalamy go : ./zmien nazwa.pliku.txt
4. Oglądamy wynik z pliku nazwa.pliku.txt.po.zmianie.txt

Treść z błędnym kodowaniem musi być zapisana w pliku. Jeżeli skrypt nie pomoże to chociaż nakieruje w wypadku innego kodowania…

Reklamy
 
Dodaj komentarz

Opublikował/a w dniu Maj 27, 2009 w ubuntu

 

Tagi:

Skomentuj

Wprowadź swoje dane lub kliknij jedną z tych ikon, aby się zalogować:

Logo WordPress.com

Komentujesz korzystając z konta WordPress.com. Wyloguj / Zmień )

Zdjęcie z Twittera

Komentujesz korzystając z konta Twitter. Wyloguj / Zmień )

Facebook photo

Komentujesz korzystając z konta Facebook. Wyloguj / Zmień )

Google+ photo

Komentujesz korzystając z konta Google+. Wyloguj / Zmień )

Connecting to %s

 
%d blogerów lubi to: