You are here: PSPad forum > České diskuzní fórum > Částečné odstranění HTML tagů v souboru
Posted by: MichalKarlik | Date: 2025-11-14 11:04 | IP: IP Logged
Dobrý den,
můžete mi, prosím pomoci? Hledám způsob, jak ze souboru vytvořeného z webové stránky "Uložením jako" z webového prohlížeče (většinou Edge) ve formátu "Webová stránka, jen HTML" částečně odstranit HTML kód.
Můžete si to představit tak, že potřebuji zachovat např. formátovací kód pro odstavec nebo tabulku, který zjednoduší import dat/údajů dále, ale odstranit vše ostatní (barvy, fonty, pozadí, popředí, skripty, obrázky apod.).
Nejlépe "něco" konfigurovatelného v batch módu, předpokládá se, že stránky spolu nesouvisí, není třeba tedy řešit vzájemné závislosti.
Děkuje a pozdravuje Michal Karlík
Posted by: pspad | Date: 2025-11-14 12:06 | IP: IP Logged
Zdravím.
Kazdy server to uklada jinak.
Castecne je mozne pouzit uzivatelsky konvertor, kde by se nadefinovala sada regularnich vyrazu, ktere by to nahrazovaly za nic.
On pak prochazi radek po radku v definici a nahrazuje, takze takovy "Batch" rezim
Dalsi moznost je skriptovani
Na konkretnejsi radu bych potreboval zdroj z toho konkretniho webu. Zkuste si ulozit zdroj ze seznam.cz, pokud se chcete podivat na zverstvo
Posted by: MichalKarlik | Date: 2025-11-14 12:32 | IP: IP Logged
Dobrý den,
děkuji za odpověď = snahu pomoci. Protože v tomto ohledu nemám žádné zkušenosti, doufal jsem v pomoc "formátovačů" jako je Tidy.
Mám PsPad velmi rád, ale pokud by to zvládla nějaká jiná aplikace (vygooglil jsem např. HTML Purifier nebo Texy!), tak by to bylo (také) fajn.
Zde bych rád využil znalostí v komunitě, abych se nesnažil dlouhodobě projet slepou ulici = chtěl něco, co tímto způsobem nejde.
Děkuje a pozdravuje Michal Karlík
PS: Uložené vzorové stránky později zašlu na support.
Posted by: pspad | Date: 2025-11-14 12:50 | IP: IP Logged
TiDy by castecne pomoct mohlo. Popis;
Zacal bych parametrem CLEAN a pak pridal oba drop-xxxxx parametry. Pak jeste show-body-only
Konfigurace tidi je v ini souboru, tak si tam pridejte vlastni sekci a muzete vyzkouset
Nejake clean sekce uz tam jsou
Posted by: AD7 | Date: 2025-11-15 18:04 | IP: IP Logged
MichalKarlik:Dobrý den,děkuji za odpověď = snahu pomoci. Protože v tomto ohledu nemám žádné zkušenosti, doufal jsem v pomoc "formátovačů" jako je Tidy.
Mám PsPad velmi rád, ale pokud by to zvládla nějaká jiná aplikace (vygooglil jsem např. HTML Purifier nebo Texy!), tak by to bylo (také) fajn.
Zde bych rád využil znalostí v komunitě, abych se nesnažil dlouhodobě projet slepou ulici = chtěl něco, co tímto způsobem nejde.
Děkuje a pozdravuje Michal Karlík
PS: Uložené vzorové stránky později zašlu na support.
Ten Texy! má web?
Posted by: MichalKarlik | Date: 2025-11-15 19:43 | IP: IP Logged
Dobrý den,
googlením jsem našel "https://jecas.cz/vycisteni-kodu", ale dále jsem zatím nepokračoval.
Pozdravuje Michal Karlík
Editor PSPad - freeware editor, © 2001 - 2025 Jan Fiala, Hosted by Webhosting TOJEONO.CZ, design by WebDesign PAY & SOFT, code Petr Dvořák, Privacy policy and GDPR