You are here: PSPad forum > České diskuzní fórum > Autodetekce kódování

Autodetekce kódování

#1 Autodetekce kódování

Posted by: lenochware | Date: 2012-10-30 08:46 | IP: IP Logged

Mám dotaz - a možná je to trivialita - jak funguje autodetekce v případě, že mám soubor který obsahuje pouze znaky z dolní části ascii-tabulky? Takový soubor by měl být imho validní utf-8. Mě to ale nabízí kódování windows-1250.
Můžu si být jistý/rozpoznat jestli je to proto, že mám někde dole ve zdrojáku nějaký cp1250 český znak, nebo je to čisté ascii?
Mě se zdá, že bych takhle mohl omylem uložit soubor jako cp1250, když někdy v budoucnu do ascii souboru přidám české znaky a nevzpomenu si, že musím zároveň změnit kódování na utf8...

Options: Reply | Quote | Up ^


#2 Re: Autodetekce kódování

Posted by: lenochware | Date: 2012-10-30 08:55 | IP: IP Logged

Už jsem si o tom něco našel tady na fóru. Čili kódování lze také nastavit v projektu a pspad si umí pamatovat poslední zvolené kódování u souboru - jenom nevím jak dlouho - trvale?

Options: Reply | Quote | Up ^


#3 Re: Autodetekce kódování

Posted by: myf | Date: 2012-10-30 09:20 | IP: IP Logged

Hádal bych že tak dlouho, dokud nepřemažeš soubor PSCache.BIN. Tedy alespoň podle toho, co pozoruji, tak ať otevřu soubor editovaný libovolně dávno, PSPad si pamatuje poslední pozici kurzoru; podle toho poznám, že/kde jsem se v něm naposledy hrabal. (Pochopitelně to platí pouze pro soubory které zůstanou na stejném místě.) Z toho soudím, že limit tahle cache nemá.

Options: Reply | Quote | Up ^


#4 Re: Autodetekce kódování

Posted by: pspad | Date: 2012-10-30 10:06 | IP: IP Logged

Pokud soubor obsahuje pouze znaky z dolni casti tabulky, je jedno, v jakem kodovani jej ulozite. Pouze Unicode kodovani si na zacatek zapisuje tzv. BOM - identifikaci kodovani, u UTF-8 je to volitelne.
Pokud soubor obsahuje BOM, je urceno i kodovani.

PSPad si posledni pouzite kodovani pro kazdy soubor pamatuje trvale, stejne jako zvyraznovac, zalozky, pozici kurzoru apod.
Vse je ulozeno v souboru PSCache.bin. Dokud ten soubor nesmazete, bude si to pamatovat.

Options: Reply | Quote | Up ^


#5 Re: Autodetekce kódování

Posted by: lenochware | Date: 2012-11-01 09:20 | IP: IP Logged

Dekuji. Nicmene by se mi libilo, kdyby to ve status radce nejak indikovalo, ze je to "bez kodovani" tj. jen ascii znaky - treba to zobrazovalo "(ascii)".

Jeste lepsi by bylo, kdyby se to pred ulozenim souboru, ktery byl plain ascii a ted jsem tam pridal nejake ceske znaky zeptalo v jakem kodovani to ma ulozit.
Takhle totiz mam X souboru v utf-8 a jeden, ktery je ascii<128, se mi zobrazuje jako windows-1250. A pokud tam jednoho dne pridam ceske znaky a zapomenu prepnout kodovani, tak se taky jako windows-1250 ulozi, coz nechci.

Chapu ze si to muzu nastavit v projektu, popr. zmenit na utf8 a ulozit soubor, jen si myslim ze by to s vyse uvedenym chovani bylo ponekud vic error proof.

Options: Reply | Quote | Up ^






Editor PSPad - freeware editor, © 2001 - 2024 Jan Fiala, Hosted by Webhosting TOJEONO.CZ, design by WebDesign PAY & SOFT, code Petr Dvořák, Privacy policy and GDPR