W związku z tym, że Gitorious z końcem maja kończy swoją działalność, postanowiłem przenieść repozytorium pwn2dict na serwis GitLab. Nowy adres repozytorium to: http://gitlab.com/pwn2dict/pwn2dict. Wszelkie zmiany i poprawki od tej pory będą trafiały tam w pierwszej kolejności i rzecz jasna tutaj.
Korzystając z okazji naprawiłem dostrzeżoną przez czytelnika regresję w ostatniej wersji, która uniemożliwiała konwersję do formatu dictd. Poprawioną wersję można pobrać ze wspomnianego wyżej repozytorium, jak i tutaj. Ze względu na drobność usterki nie podbijałem wersji skryptu.
Żadnego specjalnego wsparcia dla tego słownika nie dodawałem. Jak widać jest nieobsługiwany. Zapewne to kolejna wariacja formatu słownika. W niektórych przypadkach modyfikacje są banalne, ale np. w przypadku Uniwersalnego Słownika Języka Polskiego były na tyle poważne, że w pojedynkę nic nie zdziałałem. Na sucho trudno mi powiedzieć cokolwiek konkretniejszego i nie mogę obiecać, że jest to problem do rozwiązania w najbliższej przyszłości.
To znowu ja będę truł :P
Czy Słownik Ortograficzny 2004 jest wspierany? Ja przy próbie konwersji dostaję coś takiego:
$ python pwn2dict.py slo.win slo-nc.dict
Detected Oxford PWN 2003/2004 format...
Reading alphabetical index...
Reading words...
Writing converted data...
Traceback (most recent call last):
File "pwn2dict.py", line 727, in
src_dict.write_stardict(dest_name)
File "pwn2dict.py", line 532, in write_stardict
definition = self.read_definition(addr)
File "pwn2dict.py", line 602, in read_definition
temp = zlib.decompress(word_buffer[first_byte + 1:])
zlib.error: Error -3 while decompressing data: incorrect header check