摘要: Tato prace se zabýva tvorbou paralelniho korpusu z Wikipedie. Zaměřuje na anglicko-ceský par, ale popsaný proces lze aplikovat i jine jazykove pary Korpus sestava ceských a anglických clanků Wikipedie takových, že ceske clanky vznikly překladem těch anglických. Tyto byly staženy, textů vyextrahovany paralelni věty výsledna data byla použita jako zdrojove texty korpusu. Byly vytvořeny soubory nutne pro kompilaci korpusu, tedy vertikalni text, konfiguracni mapovaci soubor. byl zkompilovan zpřistupněn strankach Sketch Engine Masarykovy univerzity.