UK | FFUK | webmaster

intercorp - logo

1.3.2011
Stránky byly aktualizovány a přibyla německá verze.

25.2.2011
V únoru 2011 byl aktualizován paralelní korpus InterCorp. Aktualizace se týká jak paralelních dat přístupných přes Park, tak i jejich jednojazyčných částí - obě možnosti přístupu ke korpusu najdete zde. Změny spočívají kromě interního přechodu na oddělené zarovnání (stand-off alignment) především ve zpřístupnění dalších textů, což znamená nárůst na celkový rozsah přibližně 72 milionů slov. Mezi jazyky přibyla norština, nově jsou lemmatizovány a morfologicky označkovány litevština, norština a slovenština. Ve vyhledávacím rozhraní přibyla možnost přechodu na vybranou stránku a jednoúrovňový filtr výsledků dotazu.

16.10.2009
Dne 16. října 2009 byl spuštěn veřejný provoz nového rozhraní pro vyhledávání v paralelních korpusech vytvořených v rámci projektu InterCorp. Na původní adrese nyní najdete jednojazyčné verze všech paralelních korpusů zpřístupněné pomocí webového Bonita, které umožňuje používání standardních nástrojů (filtry, třídění, kolokace, frekvenční distribuce, náhodné vzorky atd.) i na korpusy jednotlivých jazyků. Zároveň došlo k dalšímu nárůstu zpřístupněných dat, nově je k dispozici také rozsáhlý výběr publicistických článků z projektu Syndicate v pěti jazycích (en, es, fr, de, ru) automaticky zarovnaných s češtinou. Celková velikost korpusu InterCorp se tak již blíží k 50 milionům slov.

4.5.2009
Dnes byla zveřejněna nově zpracovaná část textů v korpusu Intercorp.

5.12.2008
K dnešnímu dni byl veřejnosti zpřístupněn paralelní synchronní korpus Intercorp. Tento korpus je přístupný všem registrovaným uživatelům Českého národního korpusu přes vyhledávací rozhraní na adrese: http://korpus.cz/corpora/intercorp (uživatelské heslo a jméno je stejné jako pro přístup k ostatním částem ČNK, pokyny pro registraci najdete na adrese http://ucnk.ff.cuni.cz/dohody.html). Bližší informace naleznete v sekci Dokumenty.

3.11.2008
Doplnění zápisů ze schuzek a zveřejnění nové verze Návodu na přípravu textů

5.10.2005
Sekce "Zdroje textů" - přidán odkaz na databazi textů UJC.

12.9.2005
Sekce "Zdroje textů" - přidány odkazy: "ACQUIS COMMUNAUTAIRE Multilingual Corpus" a "Multext-East - "1984" Corpus".

30.6.2005
Sekce "Dokumenty" - přidán návod: "Zásady skenování textů pro InterCorp".

15.6.2005
Sekce "Zdroje textů" - přidán odkaz: "Wikipedie".

7.6.2005
Sekce "Řešitelé" - nový účastník: "Ing. Jan Sýkora, M.A., Ph.D - japonština".

12.5.2005
Sekce "Zdroje textů" - přidán odkaz: "The Slavic and East European Language Resource Center".

9.5.2005
Přesun stránek na server trnka.ff.cuni.cz (dočasné).

14.4.2005
Zprovozněna pracovní verze těchto stránek.