You are here: PSPad forum > České diskuzní fórum > Re: Unikode normalizácia
Posted by: AD7 | Date: 2025-08-13 01:41 | IP: IP Logged
Zdravím,
ak v editore otvorím súbor, ktorý obsahuje jednu alebo druhú formu unicode - NFD/NFC indikuje to PSPad nejak? Nič také tam nevidím. Občas na čosi také človek natrafí. Ak stiahne nejaký súbor v Git-u alebo tak (i.imgur.com - takto to kódovanie v titulku indikuje prezerač súborov - F3 v Altap Salamandri).
Skúsil som aj Notepad++ a ten indikuje rovnako, len UTF-8.
Išlo by to pridať dolu na lištu? Vďaka. Trebárs ako AS.
---
Krátko:
NFD – Normalization Form Decomposed
Rozložený tvar – znak s diakritikou je uložen jako základní písmeno + samostatný znak diakritiky.
Např. písmeno č je interně reprezentováno jako:
U+0063 (c)
U+030C (COMBINING CARON)
macOS (zejména HFS+ a APFS) historicky ukládají názvy souborů v NFD podobě.
Výhoda: Je univerzálnější pro porovnávání znaků a některé jazykové operace.
Nevýhoda: Některé aplikace nebo OS (hlavně na Windows) to nečekají a vidí to jako „písmeno + náhodný akcent“.
NFC – Normalization Form Composed
Složený tvar – znak s diakritikou je uložen jako jeden kódový bod.
Např. č je interně reprezentováno jako:
U+010D (LATIN SMALL LETTER C WITH CARON)
Windows v názvech souborů používají hlavně NFC, takže očekávají „hotové“ znaky.
Výhoda: Kompaktnější a lépe kompatibilní se starším softwarem.
Nevýhoda: Složitější na některé typy porovnávání, pokud máte různé formy téhož znaku.
Edited 1 time(s). Last edit at 2025-08-13 01:50 by AD7.
Posted by: AD7 | Date: 2025-08-13 01:53 | IP: IP Logged
Ešte poznámka:
na obrázku je uvedené kóvanie ZLE! Lister v AS 4 nepodporuje UTF-8. 
Posted by: pspad | Date: 2025-08-13 03:13 | IP: IP Logged
Neindikuje, ale umožňuje s informacemi code pracovat a provest prevod.
Tusim, z nekde v menu Format byly volby.
Posted by: AD7 | Date: 2025-08-13 11:58 | IP: IP Logged
Áno, veď práve preto taký "dlhý" môj príspevok. 
PSPad už má tie konverzie v menu. Ani som si ich predtým nevšimol. Tak ešte pridať info o stave. 
Len neviem či v jednom súbore môžu byť obe formy toho unicode kodovania - NFD aj NFC zaroveň. Čo sa stane ak skopírujem z iného súboru a vložím v PSPad-e do okna s iným kódovaním unikode?
Ešte hlásim chybu:
Ak som na začiatku riadku a pri Shift+End (resp. Shift+Home ak som na konci riadku) urobí "odsadenie" posledného znaku.
Screen:

Edited 3 time(s). Last edit at 2025-08-13 12:08 by AD7.
Posted by: AD7 | Date: 2025-08-13 12:12 | IP: IP Logged
Môj testovací súbor:
www.upload.ee
Je v unicode, po kanonickej dekompozícii.
Posted by: pspad | Date: 2025-08-13 15:11 | IP: IP Logged
V jednom souboru mohou byt obe verze, normalizace a denormalizace to prevede do jednotne formy
Posted by: pspad | Date: 2025-08-13 15:12 | IP: IP Logged
Ted jsem týden mimo pocitac, pak se podivam
Posted by: jadd | Date: 2025-08-15 22:34 | IP: IP Logged
AD7:Ešte hlásim chybu:
Nemas v Nastaveni(Editor1) vstup za konec radku? Taky jsem si to odklik, a pak se divi;)
Posted by: AD7 | Date: 2025-08-16 14:41 | IP: IP Logged
Uvedená chyba sa prejavuje v oboch prípadoch [x]/[ ]
Editor PSPad - freeware editor, © 2001 - 2025 Jan Fiala, Hosted by Webhosting TOJEONO.CZ, design by WebDesign PAY & SOFT, code Petr Dvořák, Privacy policy and GDPR