Prawie równo pół roku od ostatniej aktualizacji udostępniam nową wersję skryptu. Główną zmianą jest tym razem dodanie pełnego wsparcia dla formatu PWN w wersji 2003, używanego w płytach dołączanych kiedyś do papierowych wersji słowników. Konwersja została sprawdzona na Słowniku Poprawnej Polszczyzny i Słowniku Języka Polskiego PWN (podziękowania dla Jakuba Cholewki za informację zwrotną), a także angielsko-polskim słowniku PWN Oxford 2003. Ponadto zostały poprawione usterki kosmetyczne w słowniku Słowniku Języka Polskiego w wersji dołączonej do Gazety Wyborczej. Jeśli ktoś z was dysponuje którymś z tych słowników i wcześniej nie mógł ich przekonwertować, teraz nic nie powinno stanąć na przeszkodzie :)
Nową wersję można pobrać tutaj bądź tam gdzie zwykle.
Originally posted by mziab:
Yes, GoldenDict works as well. Some regard it superior. Personally, I've grown fond of StarDict :)
No problem, glad I could help.
Say the script generated files called niempol.dict, niempol.idx and niempol.ifo, then you have to create a folder named gerpol and move those 3 files there. Afterwards, you copy that folder to Stardict's dic subfolder. The procedure is exactly the same for the other dictionary, except for the names.
Originally posted by mziab:
there's a little misunderstanding in regard to the "vaveniem" file.
Since it's the largest file in the folder [about 500.000 KB]I thought it was necessary to run the dictionary.
I don't necessarely need this file [would be nice to have it…]
No, my problem is that, thanks to your script, I was able to convert the 2 .win files in 2 .dict files,
which are now present in the data folder.
But when I try to open them [StarDict has been installed] nothing happens.
What needs to be done in order to run the 2 dictionary files ?
Sorry for that simple question, but as I mentioned before, my knowledge is [it seems very ?]basic.
I'd appreciate if the both of you would give me further advice on that matter.
Thank you and best regards, Georg.
Zdaje się, że trzeba będzie użyć dictfmt ->
Przemek writes:
A wiesz może, jak przekształcić pliki indeksu z formatu idx do formatu index wymaganego przez program S60dict?
pwn2dict only converts the text entries stored in the .win files. So the results you speak of are to be expected. Sorry, but you'll have to seek help elsewhere if you want to extract the audio, as I've currently no plans to extended my script in such a manner.
przemek writes:
I converted only the files and from the pendrive version. I don't know, whether the pronunciation file (vaveniem.pak)can be converted.
Originally posted by mziab:
unfortunately it did not quite work,
now I have 2 .win folders converted to .dict
but the "waveniem.pak" [512 861 KB]
folder could not be convertet.
It seems that it is the most important, and encoded,
and your script doesn't convert it in that form.
Any suggestions ?
ps did Przemek convert from the cd version or the pendrive version [that's the one I've got ?
Nie mam pojęcia. Nie spotkałem się wcześniej z tym programem.
W każdym razie, oto skrypt do wyłapywania encji ->
Należy go odpalić na słowniku przekonwertowanym do tabfile. Utworzy plik tekstowy z wyłapanymi encjami. Wynik działania poproszę wysłać na mziab <at> :)
Przemek writes:
Pojszło :)
W przypadku tabfile dałoby się. Pliki StarDict są bardziej złożone i trzeba by przebudowywać indeksy.
A encje to właśnie to, co wymieniłeś – wpisy typu &symbol; albo &##1234; Duża część mojej roboty to właśnie wyłapywanie nowych encji i tagów i zamiana ich na coś bardziej pożytecznego w skrypcie.
W razie czego, mogę dostarczyć skrypt, który wyłapie ze słownika wszystkie takie symbole.
Anonim writes:
OK postaram się je jutro zebrać.
A tak swoją ścieżką jak przekonwertować te pliki na wersję obsługiwaną przez ten program?
Plik dict musi być spakowany do formatu "*.dz" a plik indeksu musi być w formacie "*.index" i do tego "ASCI sorted"
Przemek writes:
Jakich encji?
Nie da się tego pliku wynikowego jakoś wyedytować i po prostu użyć znajdź i zamień?
Np. tam gdzie powinno być "ß" jest zawsze "& s z l i g ;" (bez spacji)
tam gdzie powinna być "|" (pionowa krecha) jest "& b r v b a r ;"
znaki transkrypcji sprawdzę jutro.
Tak, dostarczyć mi listę nowych encji :) W razie czego mogę dostarczyć skrypt, który wyciąga takowe z danego słownika. Tak czy inaczej, będę potrzebował dalszych informacji, żeby coś z tym zrobić.
Originally posted by mziab:
Przemek writes:
Dzisiaj dokonałem konwersji słownika pwn de-pl i pl-de i ogólnie działa, ale jest problem z wyświetlaniem niemieckich znaków, np, ß (eszet) oraz znaków transkrypcji. Czy jest na to jakiś sposób?
For the record, here it is ->
Install Python, it should associate itself with Python scripts. Once you download my script, and Python automatically runs scripts when you double-click them, all you need to do is to drag the dictionary file onto pwn2dict. It'll just take the path of the file you dragged-and-dropped and try to convert it. Personally, I think this is easier and more fool-proof for newbies than other methods involving the command line.
Georg writes:
Here's the easiest way:
1) Install Python ->
2) Download a copy of pwn2dict and put it in a handy place like the desktop.
2) Find the file with the dictionary base. It has the .win extension.
3) Drag and drop that file onto pwn2dict. If everything went okay, three new files should appear. Voilla, you have converted the bases to StarDict format.
Georg writes:
I'd appreciate if you could show me how to do this for the PWN Wielki słownik polsko-niemiecki niemiecko-polski.
A friend of mine bought the pen drive version and I copied the data to my hard disk.
But obviously it want start from there.
I'm running Widows XP and my computer knowledge is basic.
feel free to answer in Polis.
Regards, Georg.