You are here: PSPad forum > České diskuzní fórum > Práca so súbormi CSV - triedenie podľa stĺpca a duplikáty?

Práca so súbormi CSV - triedenie podľa stĺpca a duplikáty?

#1 Práca so súbormi CSV - triedenie podľa stĺpca a duplikáty?

Posted by: AD7 | Date: 2016-07-27 12:30 | IP: IP Logged

Zdravím,

jak je na tom PSPad s prácou s CSV súbormi?

Potrebujem občas vymazať duplicitné riadky ak je určité pole (položka) rovnaké.

Teda niečo ako funkcia zotriedenie riadkov a vymazanie duplikátov u bežného textu, ale v tomto prípade (CSV) to utriedenie podľa určitej položky a vymazanie riadkov ak je táto položka zhodná (na ostatných položkách nezáleží, rôznej dĺžky, prípadne chýbajú: ,,,).

Príklad:

Meno,Mesto,Zviera,Vec,Číslo
Tono,Krutek,myš,kocka,7
Miloš,Zvoníček,,guľa,108
Anka,Slivková,plot,kocka,1931

Chcem: odstániť duplikáty podľa pola "Vec"

Meno,Mesto,Zviera,Vec,Číslo
Miloš,Zvoníček,,guľa,108
Tono,Krutek,myš,kocka,7

Díky.

Options: Reply | Quote | Up ^


#2 Re: Práca so súbormi CSV - triedenie podľa stĺpca a duplikáty?

Posted by: pspad | Date: 2016-07-27 16:35 | IP: IP Logged

Na tohle by bylo treba nastroj, ktery by si CSV nacetl jako by do tabulky a pak umoznil pracovat s jednotlivymi sloupci. Tohle PSPad bohuzel nezvladne. Prece jen to neni excel...

Options: Reply | Quote | Up ^


#3 Re: Práca so súbormi CSV - triedenie podľa stĺpca a duplikáty?

Posted by: vbr | Date: 2016-07-27 18:19 | IP: IP Logged

Zdravim,
napadl me jen dost pracny zpusob s regulernimi vyrazy, bohuzel ale v PSPadu zrejme nefunguje odstraneni duplikatu pri serazeni s omezenim na urcite sloupce. Je to tak zamyslene?

bylo by treba predradit retezec, podle ktereho by se melo tridit a sjednotit na zacatky radku a odsadit separatory podle nejdelsi mozne delky obsahu v tomto sloupci, napr.:

^((.*),(.*),(.*),(.*),(.*)(\s*))$
nahradit regex za:
$5_____________________________$1

po serazeni se zaberem jen na sloupce 0-25 je poradi:

guľa_____________________________Miloš,Zvoníček,,guľa,108
kocka_____________________________Anka,Slivková,plot,kocka,1931
kocka_____________________________Tono,Krutek,myš,kocka,7
Vec_____________________________Meno,Mesto,Zviera,Vec,Číslo

bohuzel ale takto nefunguje odstraneni duplicit, jak bych ocekaval.
Jinak dalsi krok by na zaver bylo nahrazeni pomocnych uvodnich casti radku

^[^_]*?_____________________________
za prazdny retezec.

Jinak by na neco podobneho bylo treba skriptovani, a taky by to asi bylo spis komplikovane.

Zdravim,
vbr

Options: Reply | Quote | Up ^






Editor PSPad - freeware editor, © 2001 - 2024 Jan Fiala, Hosted by Webhosting TOJEONO.CZ, design by WebDesign PAY & SOFT, code Petr Dvořák, Privacy policy and GDPR