Poznámky z Valné hromady
01.04.23
Poznámky z diskuze z Valné hromady ČGHS dne 11.3.2023
V rámci VH jsem vystoupil s diskuzním příspěvkem na téma použití nových technologií pro rodopisce. Snahou bylo ukázat pomůcky pro čtení německého kurentu, jeho překladu do češtiny a použití umělé inteligence.
Slíbil jsem toto krátké shrnutí, než se já nebo někdo z kolegů dostane k napsání delšího článku na jednotlivá témata.
Poznámky jsou určeny pro ty rodopisce, kteří jsou jako já: špatně čtu kurent, mám jen základy němčiny nebo jí nerozumím a jsem líný - takže hledám cesty, jak si usnadnit a zefektivnit otrockou práci.
Nejprve krátké popisy aplikací/portálů, které jsou předmětem těchto poznámek.
Transkribus Lite - app.transkribus.eu
Transkribus Lite je webová aplikace určená pro přepis textu. Používá optické rozpoznávání znaků k převodu skenovaných obrázků textu na digitální text, který můžete dále upravovat a ukládat do různých formátů.
Zde je návod, jak používat Transkribus Lite pro genealogii:
Přihlásit se: Nejprve se musíte přihlásit na webovou stránku Transkribus Lite. Pokud ještě nemáte účet, musíte si jej nejprve vytvořit. Účet vám umožní ukládat vaše transkripce a sdílet je s ostatními.
Nahrání dokumentu: Poté musíte nahrát obrázek dokumentu, který chcete přepsat. Transkribus Lite podporuje mnoho formátů obrázků, včetně JPEG, PNG a TIFF. Stačí kliknout na tlačítko "Upload" a vybrat soubor z vašeho počítače.
Rozpoznání: Jakmile je dokument nahrán, Transkribus Lite ho automaticky převede na digitální text. Může to však být někdy nepřesné, zejména u starých dokumentů psaných různými rukopisy.
Ruční úpravy: Abyste zajistili přesnější transkripci, můžete použít funkci ručních úprav. Stačí kliknout na požadované slovo nebo větu a přepsat ho ručně.
Uložení a export: Jakmile je text transkribován, můžete ho uložit v různých formátech, jako je například TXT nebo RTF. Můžete také exportovat výsledky jako PDF soubor pro snadné sdílení a tisk.
Transkribus Lite je užitečný nástroj pro genealogy, protože umožňuje snadné přepisování starých dokumentů a ukládání digitálních kopií pro budoucí použití. S pomocí Transkribus Lite můžete získat přesné a úplné informace o svých předcích a jejich životech, což vám pomůže lépe porozumět historii vaší rodiny.
DeepL - www.deepl.com/translator
DeepL je internetový překladač, který používá umělou inteligenci (AI) k překladu textu do různých jazyků. DeepL se pyšní tím, že je schopen poskytovat přesnější a přirozenější překlady než jiné internetové překladače díky využití neuronových sítí. V současné době podporuje překlad mezi 26 jazyky, včetně češtiny.
Mezi hlavní výhody DeepL patří rychlost, přesnost a schopnost zachovat kontext a přirozený tón textu. Také nabízí několik užitečných funkcí, jako je automatické doplňování a korekce textu, rozpoznávání jazyka a náhled přeloženého textu.
DeepL se využívá k překladu různých typů dokumentů, jako jsou webové stránky, emaily, smlouvy a další. Jeho schopnost překládat texty přesně a přirozeně ho činí užitečným nástrojem pro lidi, kteří potřebují překládat text mezi různými jazyky, ať už pro osobní nebo profesionální účely.
ChatGPT - chat.openai.com/chat
ChatGPT v4 je jedním z nejnovějších a nejvýkonnějších jazykových modelů vyvinutých společností OpenAI. Jedná se o vylepšenou verzi předchozího modelu GPT-3 a je trénován na obrovském množství dat z internetu a dalších zdrojů.
ChatGPT v4 se využívá v mnoha aplikacích, včetně chatbotů, asistentů virtuální reality, chatovacích aplikací a dalších. Díky vysoké přesnosti a schopnosti porozumět kontextu a nuancím lidské řeči dokáže model poskytnout uživatelům výrazně lepší interakci a zážitek.
Jednou z klíčových vlastností ChatGPT v4 je jeho schopnost generovat texty v různých jazycích, včetně angličtiny, španělštiny, francouzštiny, němčiny a dalších.
Ty výše uvedené texty v kurzívě jsem nepsal já, ale právě ten poslední nástroj ChatGPT. Vždy jsem se ho zeptal česky – co je deepl? co je a jak použít web transkribus lite? k čemu je chatgpt v4? A odpovědi jsem zkopíroval. Nic jsem neměnil, jen něco odmazal, aby to nebylo tak dlouhé. Umělá inteligence vlítla do našich životů a velké změny nás čekají. Ale o tom tyto poznámky nejsou.
Teď už víte, jaké nástroje jsem na VH představil a řekněme si, jak je pro rodopis použít. Nemusíte si nic instalovat, jen se zdarma registrovat třeba pomocí vašeho google účtu.
Příklad použití – mám německy psaný dokument v kurentu (matrika, pozemková kniha, právní zápis nebo cokoliv jiného). Nevím, co je v něm napsáno a i když něco málo přečtu, němčině nerozumím. Jak si pomocí uvedených nástrojů můžu pomoci?
1. Dokument si stáhnu/mám ho vyfocený v dobré kvalitě. Po přihlášení do Transkribus Lite si ho nahraji (Upload Image – Submit). Nahrání chvilku trvá a vidíte jeho stav v seznamu úloh (Jobs) – kde po nahrání rovnou kliknete na konec řádku (sloupec Action – ikona Linked to document).
2. V náhledu dokumentu můžete upřesnit rozmístění (layout) dokumentu, pokud jde o formulář matrik. Pokud je to běžný text, můžete rovnou kliknout dole na ikonu s velkým T – Recognition.
3. Na další obrazovce volíte rozpoznávací model, který chcete použít pro rozpoznání. Pro německý kurent volte model, který má v názvu Handwriting. Ty jsou určeny pro psané písmo. Transkribus můžete použít i pro tištěné písmo, které má v názvu Print a v popisu je i Czech (takže tištěný švabach vám rozpozná a přeloží). Vlevo je filtr a můžete vybírat modely podle vhodnosti (století, počet naučených slov atd.). Pro německý kurent je vhodný model např. German Combined M1. Objevily se nově i české modely, ale zatím nejsou vůbec vytrénované. Klikněte na Start nahoře na stránce.
4. Začne překlad na pozadí a po jeho skončení uvidíte buď rychle výsledek nebo v případě rozsáhlejšího textu vidíte výsledek v seznamu úloh.
5. Jakmile vidíte/kliknete na překlad, je v levé části originál s podtrženými slovy a vpravo pak překlad. Klikejte buď na podržené originální slovo nebo přeložené. Můžete zvětšovat stránku, opravovat překlad a další. Výsledek vyhodnoťte sami. Mějte na paměti, že překlad není úplně dokonalý. Např. Walenta přečetl jako Malenta, Bartholomeus jako Bartholamens (nerozpoznal čárku nad „u“ a četl to jako „n“) nebo česká písmena s diakritikou tento model čte špatně.
6. Pokud se vám překlad nelíbí a chcete vyzkoušet jiný model, prostě jen klikněte vpravo nahoře na datum překladu a v tabulce vymažte překlad s daným modelem. V náhledu pak klikněte znovu na Start automatic transcription a vyberte jiný model.
7. Provedené transkripce se vám ukládají a můžete je použít i později, upravovat je atd.
8. Trénovat lze i nové modely, ale potřebujete minimálně 25 stran textu. Na youtube jsou návody na trénování nebo na readcoop.eu/transkribus/howto. Snad se brzo najde skupina českých rodopisců, která bude mít čas a chuť vytrénovat správný český model humanistického a novogotického písma. ČGHS v Praze nabízí pomoc.
Pokud si chcete německý text přeložit, zkopírujte ho do DeepL (portál nebo si nainstalujte program). Před kopírováním z Transkribusu doporučuji dole v nastavení – ikona Configuration, odškrtnout volbu Show line and region number – zmizí čísla řádků z překladu.
1. Označte si text, který chcete přeložit v Transkribu a ctrl+c/ctrl+v překopírujte a vložte do DeepL okna k překladu. Budete muset možná trochu upravit (rozdělená slova sloučit, něco opravit).
2. Cílový jazyk zvolte jako češtinu. Můžete překládat i ze souboru, pokud máte originál uložený ve Wordu, PDF apod.
3. Překlad vidíte okamžitě.
Na VH jsem pak ukazoval použití chatGPT pro různá hledání. Opět dejte pozor, že na specifické a málo známé informace prostě nedokáže správně odpovědět. Ale na pomoc s většinou věcí se hodí velmi dobře.
Tomáš Krůta, 31.3.2023