You are here: PSPad forum > České diskuzní fórum > Re: Soubor s mnoha znakovymi sadami vcetne napr. hindstiny
Posted by: jadd | Date: 2025-08-06 23:16 | IP: IP Logged
Ahoj mam soubor kde vkladam retezce v ruznych znakovych sadach JP, IL, a taky IN
Soubor mam v UTF-8 no-bom (nekde jsem se uz ptal jaky rozdil je v UTF-8 a UTF-8 no-bom ale nedostal jsem odpoved, mj.)
Problem mam v tom ze cast retezce v hindstine nevidim, co udelat abych videl cely retezec.
Jinak, je mozne vubec pouzivat vice znakovych sad v jednom jedinem souboru?
Priklad:
! Dil.in;c: h:अजय डाटा;hq:जयपुर,IN
Kdyz to vlozim do pspadu a prejedu pres to jako bych to chtel kopirovat vidim dalsi znaky, ktere ted nejsou videt. Pouzivam i funkci zobrazeni netisknutelnych znaku, ktere to nerozkryji i bez toho prejezdu.
Vidite je tam taky?
Posted by: jadd | Date: 2025-08-06 23:22 | IP: IP Logged
Aha, nejsou to dalsi znaky ale nejak se tam deformuji ty viditelne jako by se duplikovaly ale ty duplikovane nejsou videt.
Vidite to taky?
Posted by: jadd | Date: 2025-08-06 23:35 | IP: IP Logged
V Notepad ++ to vidim bez deformaci, tam je nastaveno UTF-8.
Jinak pspad mam nyni v podverzi 817 32-bit
Edited 2 time(s). Last edit at 2025-08-06 23:38 by jadd.
Posted by: pspad | Date: 2025-08-07 03:22 | IP: IP Logged
Unicode obsahuje standardne BOM, coz je identifikace kodovani. No BOM se pouziva v nekterych pripadech - WEB, kde je konfiguraci dane, v jakem kodovani soubor musi byt.
Ted jsem na dovolene mimo pocitac, takze bic nevidím, podivam se na to az se vratim (asi za 14 dnu)
Posted by: jadd | Date: 2025-08-07 16:41 | IP: IP Logged
Ok, Zatim
Preji navrat bez kamaradu, svrab, stenice :D
Posted by: jadd | Date: 2025-08-16 02:58 | IP: IP Logged
problem je i u hebrestiny, ta je jak znamo RL
! CCC.co.il(ZapGroup.co.il);c:טריפל סי מחשוב,בע"מ;h:;hq:IL,פתח-תקוה
...
Vyresil jsem to enkodovanim URL (bohuzel to prodlouzi retezec).
V notepad ++ jsem mel problem u nekterych hebrejskych retezcu ve svem dokumentu, chyba byla uz pri vkladani retezce v minulosti.
...
Problemove retezce bylo nutne najit treba pres Regex
[^*?:=#$%&\s\[a-zA-Z0-9\]".',/(;_){+|–}^!<~\\@>-]
Bylo by dobre do hledani dat volbu "nalezt jen non-ASCII, nebo jeste lepe + non-JINA_ZNAK_SADA ale to uz by bylo moc dokonale;)
Diky
Posted by: jadd | Date: 2025-08-16 03:32 | IP: IP Logged
Problem i u arabstiny zase RTL
! CentralBank.ae;المركزي لدولة الإمارات
!i:مصرف الإمارات العربية المتحدة المركزي
Editor PSPad - freeware editor, © 2001 - 2026 Jan Fiala, Hosted by Webhosting TOJEONO.CZ, design by WebDesign PAY & SOFT, code Petr Dvořák, Privacy policy and GDPR