You are here: PSPad forum > České diskuzní fórum > Automatic code page detection nefunguje vo verzii 5.0.1
Posted by: agimos | Date: 2019-04-28 20:23 | IP: IP Logged
Vo verzii pspad461en.zip fungoval OK.
Mam zapnute "Autodect CP".
Mam file encoded v ISO-8859-2. Novy PSPad 5.0.1 aj 5.0.2 otvori subor nespravne v CP: "windows-1250". Takze diakritika je v editore uplne zle.
Takze dalej budem radsej pouzivat staru dobru funkcnu veriu pspad461en.
Skoda.
V prvom riadku suboru mam:
// ľščťž
aby detekcia hned narazila na diakritiku.
Edited 2 time(s). Last edit at 2019-04-28 20:28 by agimos.
Posted by: pspad | Date: 2019-04-29 03:09 | IP: IP Logged
Pokud muzu dostat soubor na testovani, pak jsem schopny zjistit, co je spatne.
Verze 5 funguje jinak. A rozdil mezi 1250 a 8859_2 je pouze nekolik znaku, podle kterych je mozne detekovat
Posted by: agimos | Date: 2019-04-29 10:04 | IP: IP Logged
Dakujem za zaujem.
So suborom je to jednoduche. Staci 5 znakov:
lsctz
s makcenmi
save-nut ako ISO-8859-2 a nastavit v PSPad "Autodtect CP" a otvorit ten subor.
Mne sa otvoril s code page 1250, takze diakritika je poskodena.
Este raz, pekne dakujem.
Posted by: pspad | Date: 2019-04-29 11:23 | IP: IP Logged
Z těch 5 znaků je pouze jediný, který se liší v ISO 8859-2 vs 1250
To je na rozpoznání opravdu málo.
Zkuste to s nějakým souvislejším textem.
Posted by: agimos | Date: 2019-04-29 13:09 | IP: IP Logged
To je link na obrazok s 5 znakmi "lstcz" s diakritikou encoded v ISO-8859-2. Ked som tento subor otvoril v pspad501 so zapnutym "Autodetect CP", vysledok je nespravne zobrazenie v code page "windows-1250" s 3 velmi neobvyklymi znakmi:
---
drive.google.com
---
Kedze z 5-ich znakov su na obrazku 3 velmi neobvykle (windows-1250), oproti 5-im s diakritikou (ISO-8859-2), tak starsia verzia pspad461 funguje spolahlivo na uvedenych 5-ich znakoch ?
Posted by: pspad | Date: 2019-04-29 14:13 | IP: IP Logged
Starší verze pracovala pouze s CP1250, ISO 8859-2 a CP 852
Novější detekuje spoustu jiných kódových stránek (japonštinu, čínštinu, západní ANSI stránky, azbuku, balkánské jazyky, arabštinu), takže detekce musí pracovat jinak.
Už se bohužel nemohu spolehnout na to, že jsou 3 znaky v ISO 8859-2 které nejsou v jiné kódové stránce a podle toho ji poznat.
Řešení je víc.
Kdykoliv je možné přepnout stránku na "správnou" a pomocí Ctrl+R přenačíst soubor. Pokud je zapnuto zapamatovat stav souboru, PSpad si bude pro soubor pamatovat i kódovou stránku
Nastavit si pro projekt konkrétní stránku - v tomto případě ISO a PSPad ji bude v rámci projektu používat.
Posted by: pspad | Date: 2019-04-29 14:15 | IP: IP Logged
Pošlete mi prosím nějaký opravdový soubor, ne jeden řádek a já zkusím zjistit, proč vyhrála ANSI 1250.
Posted by: agimos | Date: 2019-04-29 15:22 | IP: IP Logged
Super, dakujem.
Link:
drive.google.com
Posted by: agimos | Date: 2019-04-29 15:33 | IP: IP Logged
Heeeej, pardon
Vyzera, ze predchadzajuci priklad funguje OK - paspad501 prepne na ISO-8859-2.
Ale tento priklad uz zobrazuje nespravne:
drive.google.com
Dokonca prepne do "ANSI Simplified chinese".
Vdaka.
Posted by: agimos | Date: 2019-04-29 15:39 | IP: IP Logged
Len som chcel dodat, ze sa mi to velmi pacilo, ako pspad461 podla niekolkych prvych pismen krasne zdetekuje "code page". Je to uzitocne uz len kvoli tomu, ze sice na zaciatku v "source code-e" nie je skoro ziadna diakritika, ale neskor po pol roku moze byt pridana, takze ked do prveho riadku v comment-e uvediem zaklinadlo "lsctz" s diakritikou, tak otvori subor s pozadovanym encoding-om a nemusim prepinat "code page" neskor a nedojde k omylu.
Toto nedokaze ziaden iny editor v nasej galaxii .
Editor PSPad - freeware editor, © 2001 - 2023 Jan Fiala, Hosted by Webhosting TOJEONO.CZ, design by WebDesign PAY & SOFT, code Petr Dvořák, Privacy policy and GDPR