You are here: PSPad forum > České diskuzní fórum > Re: Jak odhalit zvlastni znak?
Posted by: jadd | Date: 2025-08-26 19:07 | IP: IP Logged
Pisu filtry pro ublock origin a obcas po zkopirovani se mi v jeho editoru ukaze znak kolecka, kdyz ten samy znak zkopiruju do pspadu nebo notepadu++ ani po zobrazeni netisknutelnych znaku mi tento znak neodhali.
Znak jsem vlozil do pole code;)
Overoval jsem si v editoru uo jestli ho mam stale v pameti, takze tam je;)
Posted by: jadd | Date: 2025-08-26 19:13 | IP: IP Logged
Kdyz tak jeste do quote
Quote:
nebo za timto textem
a jestli neni .. jeste ted mi editor uo tenhle znak po zkopirovani zobrazuje.
Posted by: vbr | Date: 2025-08-28 16:32 | IP: IP Logged
Zdravím,
zkopírovaný znak je:
(dec.: 8203) (hex.: 0x200b) # ZERO WIDTH SPACE (ZWSP) (Other, Format) (General Punctuation [8192-8303] [0x2000-0x206f])
v PSPadu se při posouvání kursoru (šipkami) přes jeho (neviditelnou) pozici vypíše na stavovém řádku pro kód znaku pod kursorem dotyčný kód:
8203 $200B
Kromě toho se zdá, že tenhle znak mezery nulové šířky nějak může mást počítání znaků v režimu zalomení řádků - kurzor a informace o znaku před ním posouvají podle přepnutí zalomení, při předcházejících "nulových" znacích; podobně tento znak rozhodí zobrazení, bloku vybraného textu, do kterého je zahrnut (možná se podobně chovají další "pokročilejší" znaky unicode).
Pro práci s exotičtějšími znaky se může hodit program se specifickou podporou databáze unicode, např. BabelPad
www.babelstone.co.uk
Tam je pak při najetí kursorem na stavovém řádku vidět vedle kódu U+200B i název znaku
samotný programově neviditelný znak tam ale taky vidět není, dají se k němu ale pak dohledat informace,
nebo podle kódu online, např.:
www.fileformat.info
vbr
Posted by: jadd | Date: 2025-08-28 22:56 | IP: IP Logged
Diky ti moc, trochu jsem si ho zkousel, ano, muze se hodit ale zatim mi moc nepomohl, spis ho neumim vyuzit.
Hodil by se mi analyzator neco jako statistika v pspadu, zde je v bloku 16 tech znaku
bohuzel "informace o souboru - statistika", neukaze nejen kod znaku ale hlavne na jakem radku a pozici od zacatku radku znak je
Tohle by se mi hodilo k odhaleni problemovych znaku, chapu ze by to nemohlo byt soucasti tehle statistiky pro rychly prehled, napr. kdyby mi melo podrobne uvest treba 10K znaku pismene X;)
Quote:v PSPadu se při posouvání kursoru (šipkami) přes jeho (neviditelnou) pozici vypíše na stavovém řádku pro kód znaku pod kursorem dotyčný kód:
8203 $200B
Abych takto hledal znaky u rozsahleho dokumentu si radsi ani nechci predstavovat ale mas pravdu, jde to;)
Edited 1 time(s). Last edit at 2025-08-28 23:04 by jadd.
Posted by: vbr | Date: 2025-08-29 14:13 | IP: IP Logged
Zdravím,
pro opakovanou práci s delšími kódy a více podobnými znaky postupné procházení kursorem opravdu moc použitelné není...
V rámci PSPadu by šel i jiný způsob, pomocí hledání regulérními výrazy - do hledacího dialogu se zadá tečka a zaškrtne se tento typ hledání:
.
[x] Regulární výrazy
(je to výraz pro jeden libovolný znak, s výjimkou zalomení řádky \n
hledání jde upravit, např. \W neslovní znaky, např. mezera, závorka, středník, tečka aj.)
Tlačítkem [Kopírovat] v hledacím dialogu se do nového tabu pspadu vypíšou výsledky hledání, tj. vždy jeden znak na samostatném řádku.
Tyto "podezřelé" vypadají jako prázdné; když se přes ně šipkami přejede kursorem, jsou zase vidět jejich číselné kódy.
Mohlo by jít z menu hledání použít i tlačítko [Seznam], to nálezy zobrazí jako prokliknutelné položky, ale slučuje více nálezů v rámci jedné řádky; při opakovaných výskytech vedle sebe se to nehodí.
Pokud už se hledá konkrétní znak, je to jednodušší, v PSPadu s dotyčnou nulovou mezerou funguje běžné hledání, není ale ani v dialogu vidět; z textu se vybírá kurzorovou šipkou (se shiftem) - myší to asi(?) nejde
- při zapnutém zvýrazňování:
Nastavení: Editor 2: [x] Zvýraznit výskyty označeného textu
- jsou pak dokonce vybarvena všechna místa nálezů ve viditelné části okna (se zúženým, jakoby meziznakovým, vybarvením)
Také jde hledat podle hexadecimálních hodnot unicode, např. interval znaků zahrnující i "mezeru nulové šířky" může být:
[\x{2000}-\x{200F}]
Při zadání do hledání a nalezení pak funguje i přesun na další výskyty F3.
Pokud jde o použití ve filtrech (reklamních apod.?) myslel jsem, že neviditelné znaky ve webových jménech/adresách být nesmí (?) resp. se tam mohou/mají ignorovat..., takto se nastavené filtry mohou obejít nějakým náhodným rozšířením nastaveného kódu o takovéto neviditelné znaky? To ale každopádně bude složitější než hledání jednotlivých, i exotických, znaků...
vbr
Posted by: AD7 | Date: 2025-08-30 12:24 | IP: IP Logged
BTW. Kde sa tieto znaky vyskytujú/používajú?
Posted by: jadd | Date: 2025-08-31 18:23 | IP: IP Logged
Ahoj, promin za zdrzenou odpoved;)
Pisu mj. filtry pro web takze to beru z webu;)
Editor uo je sice jednoduchy ktery ma jen hledaci pole, ktere umi ale i RE.
Editor uo pouziva projekt z codemirror.net ktery rozpozna vizuelne treba to zvlastni kolecko nebo rozdil v
/wp-content/uploads/20*/*/*_300x250.jpg|
/wp-content/uploads/20*/*/*_300х250.jpg|
Prisel jsem na ten rozdil ze jsem pouzil Notepad++ a pouzil fci pod oznacenim "Najit znaky z rozsahu" v tom Non-ASCII znaky (128-255), protoze N++ neumi jako PSPad rozpoznat znak pri prejezdu ve stavove liste, predim jsem ale ten radek vyhledal pres editor uo, kde jsem rozdil videl hned;)
Nebo proc ve zdanlive jednoduche domene
sportunion-wien.at
teichmann–motors.at
muze by rozdil, asi jsem ji predim jen zkopiroval aniz bych ji otevrel v URL poli;)
Posted by: jadd | Date: 2025-09-03 21:17 | IP: IP Logged
Quote:zvyrazneni Editor2
Editor1, to jsem mel ale jeste je tam zobrazit svislou caru to je velmi uzitecne taky;)
Quote:s dotyčnou nulovou mezerou funguje běžné hledání, není ale ani v dialogu vidět; z textu se vybírá kurzorovou šipkou (se shiftem) - myší to asi(?) nejde
Dekuju moc za tohle, mas pravdu mys to nevezme
Posted by: jadd | Date: 2025-09-04 20:00 | IP: IP Logged
Udelal jsem si pro svou potrebu kratky vycuc no-ASCII znaku, kde na zacatku radku je znak nasledovany mezerou a kodem znaku kopirovane pred mezerou s naslednou konverzi uvnitr editoru.
Dostanu u pspadu problem u posledniho zapisu kde konec radku je pred C a za to C uz se nedostanu u notepadu++ nemam problem.
Kde je prosim chyba?
-- A --
Ä %C3%84 lat (accent-long)
 %C3%82 lat (circumflex)
а %D0%B0 cyr
ä %C3%A4 lat
á %C3%A1 lat
â %C3%A2 lat
-- AE --
-- B --
-- C --
č %C4%8D lat (caron)
-- D --
Д %D0%94 cyr
-- E --
è %C3%A8 lat (grave accent-long)
é %C3%A9 lat
ë %C3%AB lat (diaresis [de:trema])
ě %C4%9B lat
-- F --
-- G --
г %D0%B3 cyr
-- H --
-- I --
İ %C4%B0 lat
í %C3%AD lat
-- J --
-- K --
-- L --
-- M --
-- N --
н %D0%BD cyr
ñ %C3%B1 lat (soft)
-- O --
о %D0%BE cyr (omicron)
ö %C3%B6 lat
ó %C3%B3 lat (acute accent-long)
ō %C5%8D lat (macron)
-- OE --
ø %C3%B8 lat
-- P --
-- Q --
-- R --
ř %C5%99 lat (caron)
-- S --
ß %C3%9F lat (sharp)
ş %C5%9F lat (cedilla)
Š %C5%A0 lat (caron)
š %C5%A1 lat
-- T --
-- U --
ü %C3%BC lat (diaresis [de:trema])
ü u%CC%88 lat (u-combining diaresis)
-- V --
в %D0%B2 cyr
-- W --
-- X --
-- Y --
ý %C3%BD lat (acute accent-longer)
-- Z --
ž %C5%BE lat (caron)
-- OTHER --
ь %D1%8C cyr (soft знак)
³ %C2%B3
· %C2%B7 lat (interpunct - interpoint)
´ %C2%B4
’ %E2%80%99 lat (apostrophe)
“ %E2%80%9C (double low-9 end-quotation mark)
” %E2%80%9D (right double quotation mark)
„ %E2%80%9E (double low-9 begin-quotation mark)
® %C2%AE
-- ZERO WIDTH SPACE --
%20
%C2%A0
%E2%80%AC
Edited 1 time(s). Last edit at 2025-09-04 20:05 by jadd.
Editor PSPad - freeware editor, © 2001 - 2026 Jan Fiala, Hosted by Webhosting TOJEONO.CZ, design by WebDesign PAY & SOFT, code Petr Dvořák, Privacy policy and GDPR