Poznámky z Valné hromady

01.04.23

Poznámky z diskuze z Valné hromady ČGHS dne 11.3.2023

V rámci VH jsem vystoupil s diskuzním příspěvkem na téma použití nových technologií pro rodopisce. Snahou bylo ukázat pomůcky pro čtení německého kurentu, jeho překladu do češtiny a použití umělé inteligence.

Slíbil jsem toto krátké shrnutí, než se já nebo někdo z kolegů dostane k napsání delšího článku na jednotlivá témata.

Poznámky jsou určeny pro ty rodopisce, kteří jsou jako já: špatně čtu kurent, mám jen základy němčiny nebo jí nerozumím a jsem líný - takže hledám cesty, jak si usnadnit a zefektivnit otrockou práci.

Nejprve krátké popisy aplikací/portálů, které jsou předmětem těchto poznámek.

Transkribus Lite - app.transkribus.eu

Transkribus Lite je webová aplikace určená pro přepis textu. Používá optické rozpoznávání znaků k převodu skenovaných obrázků textu na digitální text, který můžete dále upravovat a ukládat do různých formátů.

Zde je návod, jak používat Transkribus Lite pro genealogii:

Přihlásit se: Nejprve se musíte přihlásit na webovou stránku Transkribus Lite. Pokud ještě nemáte účet, musíte si jej nejprve vytvořit. Účet vám umožní ukládat vaše transkripce a sdílet je s ostatními.

Nahrání dokumentu: Poté musíte nahrát obrázek dokumentu, který chcete přepsat. Transkribus Lite podporuje mnoho formátů obrázků, včetně JPEG, PNG a TIFF. Stačí kliknout na tlačítko "Upload" a vybrat soubor z vašeho počítače.

Rozpoznání: Jakmile je dokument nahrán, Transkribus Lite ho automaticky převede na digitální text. Může to však být někdy nepřesné, zejména u starých dokumentů psaných různými rukopisy.

Ruční úpravy: Abyste zajistili přesnější transkripci, můžete použít funkci ručních úprav. Stačí kliknout na požadované slovo nebo větu a přepsat ho ručně.

Uložení a export: Jakmile je text transkribován, můžete ho uložit v různých formátech, jako je například TXT nebo RTF. Můžete také exportovat výsledky jako PDF soubor pro snadné sdílení a tisk.

Transkribus Lite je užitečný nástroj pro genealogy, protože umožňuje snadné přepisování starých dokumentů a ukládání digitálních kopií pro budoucí použití. S pomocí Transkribus Lite můžete získat přesné a úplné informace o svých předcích a jejich životech, což vám pomůže lépe porozumět historii vaší rodiny.

DeepL - www.deepl.com/translator

DeepL je internetový překladač, který používá umělou inteligenci (AI) k překladu textu do různých jazyků. DeepL se pyšní tím, že je schopen poskytovat přesnější a přirozenější překlady než jiné internetové překladače díky využití neuronových sítí. V současné době podporuje překlad mezi 26 jazyky, včetně češtiny.

Mezi hlavní výhody DeepL patří rychlost, přesnost a schopnost zachovat kontext a přirozený tón textu. Také nabízí několik užitečných funkcí, jako je automatické doplňování a korekce textu, rozpoznávání jazyka a náhled přeloženého textu.

DeepL se využívá k překladu různých typů dokumentů, jako jsou webové stránky, emaily, smlouvy a další. Jeho schopnost překládat texty přesně a přirozeně ho činí užitečným nástrojem pro lidi, kteří potřebují překládat text mezi různými jazyky, ať už pro osobní nebo profesionální účely.

ChatGPT - chat.openai.com/chat

ChatGPT v4 je jedním z nejnovějších a nejvýkonnějších jazykových modelů vyvinutých společností OpenAI. Jedná se o vylepšenou verzi předchozího modelu GPT-3 a je trénován na obrovském množství dat z internetu a dalších zdrojů.

ChatGPT v4 se využívá v mnoha aplikacích, včetně chatbotů, asistentů virtuální reality, chatovacích aplikací a dalších. Díky vysoké přesnosti a schopnosti porozumět kontextu a nuancím lidské řeči dokáže model poskytnout uživatelům výrazně lepší interakci a zážitek.

Jednou z klíčových vlastností ChatGPT v4 je jeho schopnost generovat texty v různých jazycích, včetně angličtiny, španělštiny, francouzštiny, němčiny a dalších.

 

Ty výše uvedené texty v kurzívě jsem nepsal já, ale právě ten poslední nástroj ChatGPT. Vždy jsem se ho zeptal česky – co je deepl? co je a jak použít web transkribus lite? k čemu je chatgpt v4? A odpovědi jsem zkopíroval. Nic jsem neměnil, jen něco odmazal, aby to nebylo tak dlouhé. Umělá inteligence vlítla do našich životů a velké změny nás čekají. Ale o tom tyto poznámky nejsou.

Teď už víte, jaké nástroje jsem na VH představil a řekněme si, jak je pro rodopis použít. Nemusíte si nic instalovat, jen se zdarma registrovat třeba pomocí vašeho google účtu.

Příklad použití – mám německy psaný dokument v kurentu (matrika, pozemková kniha, právní zápis nebo cokoliv jiného). Nevím, co je v něm napsáno a i když něco málo přečtu, němčině nerozumím. Jak si pomocí uvedených nástrojů můžu pomoci?

1.       Dokument si stáhnu/mám ho vyfocený v dobré kvalitě. Po přihlášení do Transkribus Lite si ho nahraji (Upload Image – Submit). Nahrání chvilku trvá a vidíte jeho stav v seznamu úloh (Jobs) – kde po nahrání rovnou kliknete na konec řádku (sloupec Action – ikona Linked to document).

2.      V náhledu dokumentu můžete upřesnit rozmístění (layout) dokumentu, pokud jde o formulář matrik. Pokud je to běžný text, můžete rovnou kliknout dole na ikonu s velkým T – Recognition.

3.      Na další obrazovce volíte rozpoznávací model, který chcete použít pro rozpoznání. Pro německý kurent volte model, který má v názvu Handwriting. Ty jsou určeny pro psané písmo. Transkribus můžete použít i pro tištěné písmo, které má v názvu Print a v popisu  je i Czech (takže tištěný švabach vám rozpozná a přeloží). Vlevo je filtr a můžete vybírat modely podle vhodnosti (století, počet naučených slov atd.). Pro německý kurent je vhodný model např. German Combined M1. Objevily se nově i české modely, ale zatím nejsou vůbec vytrénované. Klikněte na Start nahoře na stránce.

4.     Začne překlad na pozadí a po jeho skončení uvidíte buď rychle výsledek nebo v případě rozsáhlejšího textu vidíte výsledek v seznamu úloh.

5.      Jakmile vidíte/kliknete na překlad, je v levé části originál s podtrženými slovy a vpravo pak překlad. Klikejte buď na podržené originální slovo nebo přeložené. Můžete zvětšovat stránku, opravovat překlad a další. Výsledek vyhodnoťte sami. Mějte na paměti, že překlad není úplně dokonalý. Např. Walenta přečetl jako Malenta, Bartholomeus jako Bartholamens (nerozpoznal čárku nad „u“ a četl to jako „n“) nebo česká písmena s diakritikou tento model čte špatně.

6.     Pokud se vám překlad nelíbí a chcete vyzkoušet jiný model, prostě jen klikněte vpravo nahoře na datum překladu a v tabulce vymažte překlad s daným modelem. V náhledu pak klikněte znovu na Start automatic transcription a vyberte jiný model.

7.     Provedené transkripce se vám ukládají a můžete je použít i později, upravovat je atd.

8.     Trénovat lze i nové modely, ale potřebujete minimálně 25 stran textu. Na youtube jsou návody na trénování nebo na readcoop.eu/transkribus/howto. Snad se brzo najde skupina českých rodopisců, která bude mít čas a chuť vytrénovat správný český model humanistického a novogotického písma. ČGHS v Praze nabízí pomoc.

Pokud si chcete německý text přeložit, zkopírujte ho do DeepL (portál nebo si nainstalujte program). Před kopírováním z Transkribusu doporučuji dole v nastavení – ikona Configuration, odškrtnout volbu Show line and region number – zmizí čísla řádků z překladu.

1.       Označte si text, který chcete přeložit v Transkribu a ctrl+c/ctrl+v překopírujte a vložte do DeepL okna k překladu. Budete muset možná trochu upravit (rozdělená slova sloučit, něco opravit).

2.      Cílový jazyk zvolte jako češtinu. Můžete překládat i ze souboru, pokud máte originál uložený ve Wordu, PDF apod.

3.      Překlad vidíte okamžitě.  

 

Na VH jsem pak ukazoval použití chatGPT pro různá hledání. Opět dejte pozor, že na specifické a málo známé informace prostě nedokáže správně odpovědět. Ale na pomoc s většinou věcí se hodí velmi dobře.

 

Tomáš Krůta, 31.3.2023


↑ na navigaci