You are here: PSPad forum > České diskuzní fórum > Re: Unikode normalizácia

Re: Unikode normalizácia

#1 Unikode normalizácia

Posted by: AD7 | Date: 2025-08-13 01:41 | IP: IP Logged

Zdravím,
ak v editore otvorím súbor, ktorý obsahuje jednu alebo druhú formu unicode - NFD/NFC indikuje to PSPad nejak? Nič také tam nevidím. Občas na čosi také človek natrafí. Ak stiahne nejaký súbor v Git-u alebo tak (i.imgur.com - takto to kódovanie v titulku indikuje prezerač súborov - F3 v Altap Salamandri).

Skúsil som aj Notepad++ a ten indikuje rovnako, len UTF-8.

Išlo by to pridať dolu na lištu? Vďaka. Trebárs ako AS.

---
Krátko:

NFD – Normalization Form Decomposed
Rozložený tvar – znak s diakritikou je uložen jako základní písmeno + samostatný znak diakritiky.
Např. písmeno č je interně reprezentováno jako:
U+0063 (c)
U+030C (COMBINING CARON)
macOS (zejména HFS+ a APFS) historicky ukládají názvy souborů v NFD podobě.

Výhoda: Je univerzálnější pro porovnávání znaků a některé jazykové operace.
Nevýhoda: Některé aplikace nebo OS (hlavně na Windows) to nečekají a vidí to jako „písmeno + náhodný akcent“.

NFC – Normalization Form Composed
Složený tvar – znak s diakritikou je uložen jako jeden kódový bod.
Např. č je interně reprezentováno jako:
U+010D (LATIN SMALL LETTER C WITH CARON)
Windows v názvech souborů používají hlavně NFC, takže očekávají „hotové“ znaky.

Výhoda: Kompaktnější a lépe kompatibilní se starším softwarem.
Nevýhoda: Složitější na některé typy porovnávání, pokud máte různé formy téhož znaku.

Edited 1 time(s). Last edit at 2025-08-13 01:50 by AD7.

Options: Reply | Quote | Up ^


#2 Re: Unikode normalizácia

Posted by: AD7 | Date: 2025-08-13 01:53 | IP: IP Logged

Ešte poznámka:
na obrázku je uvedené kóvanie ZLE! Lister v AS 4 nepodporuje UTF-8. smiling smiley

Options: Reply | Quote | Up ^


#3 Re: Unikode normalizácia

Posted by: pspad | Date: 2025-08-13 03:13 | IP: IP Logged

Neindikuje, ale umožňuje s informacemi code pracovat a provest prevod.
Tusim, z nekde v menu Format byly volby.

Options: Reply | Quote | Up ^


#4 Re: Unikode normalizácia

Posted by: AD7 | Date: 2025-08-13 11:58 | IP: IP Logged

Áno, veď práve preto taký "dlhý" môj príspevok. grinning smiley

PSPad už má tie konverzie v menu. Ani som si ich predtým nevšimol. Tak ešte pridať info o stave. smiling smiley

Len neviem či v jednom súbore môžu byť obe formy toho unicode kodovania - NFD aj NFC zaroveň. Čo sa stane ak skopírujem z iného súboru a vložím v PSPad-e do okna s iným kódovaním unikode?

Ešte hlásim chybu:
Ak som na začiatku riadku a pri Shift+End (resp. Shift+Home ak som na konci riadku) urobí "odsadenie" posledného znaku.

Screen:
image

Edited 3 time(s). Last edit at 2025-08-13 12:08 by AD7.

Options: Reply | Quote | Up ^


#5 Re: Unikode normalizácia

Posted by: AD7 | Date: 2025-08-13 12:12 | IP: IP Logged

Môj testovací súbor:
www.upload.ee

Je v unicode, po kanonickej dekompozícii.

Options: Reply | Quote | Up ^


#6 Re: Unikode normalizácia

Posted by: pspad | Date: 2025-08-13 15:11 | IP: IP Logged

V jednom souboru mohou byt obe verze, normalizace a denormalizace to prevede do jednotne formy

Options: Reply | Quote | Up ^


#7 Re: Unikode normalizácia

Posted by: pspad | Date: 2025-08-13 15:12 | IP: IP Logged

Ted jsem týden mimo pocitac, pak se podivam

Options: Reply | Quote | Up ^


#8 Re: Unikode normalizácia

Posted by: jadd | Date: 2025-08-15 22:34 | IP: IP Logged

AD7:
Ešte hlásim chybu:

Nemas v Nastaveni(Editor1) vstup za konec radku? Taky jsem si to odklik, a pak se divi;)

Options: Reply | Quote | Up ^


#9 Re: Unikode normalizácia

Posted by: AD7 | Date: 2025-08-16 14:41 | IP: IP Logged

Uvedená chyba sa prejavuje v oboch prípadoch [x]/[ ]

Options: Reply | Quote | Up ^






Editor PSPad - freeware editor, © 2001 - 2025 Jan Fiala, Hosted by Webhosting TOJEONO.CZ, design by WebDesign PAY & SOFT, code Petr Dvořák, Privacy policy and GDPR