You are here: PSPad forum > České diskuzní fórum > Re: Nahradit v souborech > poškozené soubory

Re: Nahradit v souborech > poškozené soubory

#1 Nahradit v souborech > poškozené soubory

Posted by: peersoft | Date: 2020-06-15 10:00 | IP: IP Logged

Zdravím,
Toto je vcelku závažný bug. Mám cca 125 souboru .htm v kódování Windows-1250 (pro HTML nápovědu .chm). Protože ale původně pocházejí z anglického originálu, který jsem nechal překládat do češtiny, soubory obsahují meta tag http-equiv s kódovou stránkou ISO-8859-1. Spustím tedy hromadnou náhradu v souborech, jako nahrazovaný řetězec dám "charset=ISO-8859-1" (bez uvozovek), jako nahrazující řetězec dám "charset=Windows-1250", zvolím kódovou stránku souboru Central Europe 1250, zvolím, že chci uplatnit na soubory v adresáři a zvolím adresář a masku souborů *.*. Když proběhne, sice je náhrada v souborech vidět, ale soubory mají dvojnásobnou velikost a vypadají, při průzkumu přes hex editor, jak kdyby byly v kódování Unicode UTF-16BE, tedy první byte je 00 a druhý byte např. 3C pro "<". Když jsem pak soubory zkusmo převedl přes funkci hromadného převodu kódových stránek a ručně jsem zvolil kódování UTF-16BE a jako cílové Windows-1250, opravdu se soubory tváří správně, nemohu však takový výstup garantovat jako naprosto bezchybný, protože nevím, co se při hromadné náhradě uvnitř souborů opravdu stalo. Děje se jak v jednom z posledních buildů (504), tak v ostré verzi 5.0.3.

--
Peer

Edited 1 time(s). Last edit at 2020-06-15 10:02 by peersoft.

Options: Reply | Quote | Up ^


#2 Re: Nahradit v souborech > poškozené soubory

Posted by: pspad | Date: 2020-06-15 10:57 | IP: IP Logged

Bylo by mozne na support mail poslat nejaky soubor pro otestovani?

Options: Reply | Quote | Up ^


#3 Re: Nahradit v souborech > poškozené soubory

Posted by: pspad | Date: 2020-06-15 12:02 | IP: IP Logged

Omlouvám se, ale nemůžu potvrdit.
Vytvořil jsem si nějaké soubory v HTML s meta charset ISO, uložené v kódování CP 1250.
Přes hledat nahradit v souborech jsem provedl hledani ISO-8859-1 za WINDOWS-1250 s nastavenou kodovou strankou ANSI Central Europian (1250)

Po nahrazeni zustaly soubory v kodovani 1250, nedoslo k zmene velikosti, ke zmene kodove stranky apod.

Jedine, co me napada, ze soubory nebyly vkodovani CP1250, ale treba UTF-8.
Dalsi vec, jak jste se dival na obsah souboru? Primo v HEXa editoru nebo otevrit soubor a zobrazit v HEXa?

Options: Reply | Quote | Up ^


#4 Re: Nahradit v souborech > poškozené soubory

Posted by: peersoft | Date: 2020-06-15 12:27 | IP: IP Logged

Díval jsem se přes hex editor v Total Commanderu. Soubory klidně pošlu. Byly původně v UTF-8 bez BOM, tak jsem je přes PSPad převedl do Windows-1250 a pak provedl to nahrazování.

--
Peer

Options: Reply | Quote | Up ^


#5 Re: Nahradit v souborech > poškozené soubory

Posted by: pspad | Date: 2020-06-15 13:20 | IP: IP Logged

PSPad puvodni soubory pri konverzi CP neprepisuje. Uklada je do cilove slozky.

Zkousel jsem to s temi vasimi soubory, pri prepsani z ISO na windows-1250 mi to prepsalo jen 2, tak jsem to pustil prepsat opacne a nahradil jsem to zpatky na ISO.
Soubory zustaly v kodovani ansi 1250.

Jste schopny tu chybu zopakovat?

Options: Reply | Quote | Up ^


#6 Re: Nahradit v souborech > poškozené soubory

Posted by: peersoft | Date: 2020-06-15 13:30 | IP: IP Logged

Ano, zopakoval jsem to nyní s tím, že jsem nahradil obráceně z Windows-1250 na ISO-8859-1 a chyba je tatáž. Pomůže vám sada INI souborů nastavení?

--
Peer

Options: Reply | Quote | Up ^


#7 Re: Nahradit v souborech > poškozené soubory

Posted by: pspad | Date: 2020-06-15 13:41 | IP: IP Logged

Poslete mi soubor Recent.ini, kde je ulozeno nastaveni hledat/nahradit a nejaky nahrazeny soubor ve spatnem kodovani.

Options: Reply | Quote | Up ^


#8 Re: Nahradit v souborech > poškozené soubory

Posted by: pspad | Date: 2020-06-15 14:40 | IP: IP Logged

Problem odhalen. Oprava bude nejpozdeji o vikendu v dalsim buildu

Options: Reply | Quote | Up ^


#9 Re: Nahradit v souborech > poškozené soubory

Posted by: peersoft | Date: 2020-06-15 15:12 | IP: IP Logged

Moc děkuji!

--
Peer

Options: Reply | Quote | Up ^






Editor PSPad - freeware editor, © 2001 - 2020 Jan Fiala, Hosted by Webhosting TOJEONO.CZ, design by WebDesign PAY & SOFT, code Petr Dvořák, Privacy policy and GDPR