You are here: PSPad forum > České diskuzní fórum > Re: Editace mhtml (mht) souboru
Posted by: MichalKarlik | Date: 2025-04-06 17:55 | IP: IP Logged
Dobrý den, můžete mi, prosím, pomoci? Programem Microsoft Edge s vestavěnou funkcí "Uložit jako, webová stránka, jediný soubor" jsem získal z webu eur-lex.europa.eu mhtml soubor o velkosti cca 27 MB/1100 stránek.
Cílem je z uvedeného souboru připravit "kondenzát" pro import do programů Excel/Word na další zpracování.
Takže uvítám upozornění na program, který by dokázal hromadně (případně na klávesovou zkratku) nějakou funkcí/makrem např.:
odstranit pro mne nepotřebné části (jako jsou např. aktivní odkazy, celé odstavce)
"skákat" po obrázcích v textu
pracovat pokud možno ve "vizuálním" módu.
nejlépe freeware nebo něco "nízkorozpočtového"…
Již jsem to zkoušel ve Wordu a zdá se, že text je v některých částech "zašmodrchaný" v rámech a tabulkách, takže to není úplně jednoduché.
Za odpověď předem děkuje a pozdravuje Michal Karlík
Posted by: pspad | Date: 2025-04-06 18:52 | IP: IP Logged
Zkuste zmenit priponu na ZIP, rozxipovat a pak si s tim muzete delat, co potrebujete. Mel by to byt archiv s html zdroji, css, obrazky...
Posted by: MichalKarlik | Date: 2025-04-09 18:12 | IP: IP Logged
Děkuji za snahu pomoci. Soubor mhtml, přejmenovaný na zip, WinZip Pro vyhodnotil jako poškozený soubor a nešel rozbalit.
Výraznějšího pokroku jsem dosáhl s programem Word. Naučil jsem se "skákat" v textu dokumentu "po obrázku/tabulce", což mi hodně pomáhá.
Pokud by byl někdo ochotný sdílet zkušenosti z náročnějšího zpracování textu pomocí VBA ve Wordu/Excelu (jak programově vyvolat v tabulce "přizpůsobit textu", zjistit nepravidelnosti v rozložení v tabulce apod.), budu velmi pozorným posluchačem.
Typů zpracování není mnoho, ale jde o rozsáhlé dokumenty (podle formátování cca 1000 - 2000 stran) s tím, že dávkové zpracování bez interakce pravděpodobně není možné.
Předem děkuje a pozdravuje Michal Karlík
Posted by: pspad | Date: 2025-04-09 19:02 | IP: IP Logged
Aha, tak yo jsem mel v hlave pomotane. Dle wiki
en.m.wikipedia.org
Je to obdoba .EML formatu - proste vse zakodovane jako prilohy
Posted by: vbr | Date: 2025-04-10 22:03 | IP: IP Logged
Zdravím,
pokud se neplánuje dávkové zpracování bez interakce, myslím, že kódování skriptů ve VBA by bylo spíš zdlouhavé a možná celkově neefektivní.
Jendodušší by mohlo být nahrání makra ve wordu, které by zahrnovalo potřebné kroky nebo jejich sekvence - můžou to být funkce menu, tlačítek, posuny kurzoru i hledání aj.
Makrům se dají nastavit i klávesové zkratky - typický postup by tak mohl být kombinovat (třeba zase klávesovou zkratkou) hledání místa k úpravě a následně vyvolání makra k úpravám na dané pozici; nebo může makro už samo zahrnout přechod na další nalezenou vhodnou pozici a při procházení se buď potvrdí upravovací makro nebo jen přechod k dalšímu místu.
vbr
Posted by: MichalKarlik | Date: 2025-04-13 19:23 | IP: IP Logged
Také zdravím, děkuji za reakci. Nejprve popíšu letmo svoji aplikaci - mám téměř stejný text ve 23 jazycích, který je podle formátování dlouhý 1000 až 2000 stran. Cílem je udělat z českého textu "kondenzát" a doplnit ho odpovídajícím "slovníčkem" z ostatních jazyků.
Situace je složitější, protože třeba makro záznamník nenahraje (alespoň mně) odpovídající příkaz pro akci v tabulce "Přizpůsobit textu", což by mi velmi pomohlo. Nebo bych potřeboval zaměnit obrázek v tabulce textem. Také se "peru" s detekcí tabulky, které má nepravidelnou strukturu = v buňce tabulky je další tabulka.
Základem je přístup "neudělat jakoukoliv chybu", která by mohla nevhodně modifikovat nebo poškodit dokument, protože to zkontroluji jen obtížně.
Jsem "na začátku", takže zkouším vytvářet VBA skripty s minimem interakce, které budou přenosné a fungovat pokud možno všude (napříč verzemi). Hlavně mi jde o zvýraznění jednotlivých prvků v dokumentu, protože ne vždy je to na první pohled zřejmé (tabulka v tabulce bez ohraničení apod.).
Odhaduji, že vlastní "ruční" práce nebude mnoho, za předpokladu, že se mi podaří naprogramovat odpovídající makra. A až budu mít "český kondenzát", tak ho budu doplňovat textem ze stejných míst z ostatních jazykových verzí.
Pozdravuje Michal Karlík
Editor PSPad - freeware editor, © 2001 - 2025 Jan Fiala, Hosted by Webhosting TOJEONO.CZ, design by WebDesign PAY & SOFT, code Petr Dvořák, Privacy policy and GDPR