Back to Question Center
0

Semalt: Webgune desegokiak famatuak

1 answers:

Eskuz nahi dituzun datuak garbitzeko, programazioko trebetasun bikainak izan behar dituzu. Bestela, web-datuen erauzketa tresnen sorta bat erabil dezakezu, datu zehatzak irakurtzeko, egituratzeko eta bereizteko.Hala eta guztiz ere, webgune batzuk ezin dira desmunta daitezke, eta horrek esan nahi du anti-scraping teknikak erabiltzen dituztela edo aldizka aldatzen dituztela - bonus chips. Adibidez, LinkedIn, Alibaba eta Facebook-ek saioaren xehetasunak, CAPTCHA sartzeko eskaera eta IP helbideak blokeatu behar dituzte beren erabiltzaileen babesa eta pribatutasuna bermatzeko.

1. Facebook:

Facebook sare sozialen webgune ospetsuenetako bat da mundu osoan zehar 20 milioi erabiltzaile aktibatu dituena.Aplikazio ugari eta datuak scraping programak dira, banakako informazioa Facebook-tik ateratzeko asmoa dutenak. Zoritxarrez, tresna gehienek ez dute datu zehatzak eta irakurgarriak ematen. Facebookek spammers eta hackerrek beren erabiltzaileei buruzko informazioa biltzeko zailtasunak dituzte. HTML Python-en analizatzaile baten laguntzarekin bakarrik lortu daiteke, baina webmasters eta freelancers gehienek ez dakite Python-en oinarriak. Duela gutxi, Facebook-en sareta bat abian jarri zen, sare sozialen webgune honen informazio garrantzitsua ateratzeko. Facebook arrapala batekin, Facebook erabiltzaileen izenak eta helbide elektronikoak soilik jaso ditzakezu. Datu sakonak jaso nahi badituzu, ezin duzu tresna hau edo beste edozein arrapala erabili.

2. LinkedIn:

LinkedIn beste sare sozialen webgune bat da, ezinezkoa da labana. Hala ere, zati batzuk partzialki atera ditzakezu zenbait web orrialde batetik, baina informazio gehienak eskuraezinak dira. LinkedIn profil publiko batetik bestera lotzeko informazioa soilik inportatu dezakezu. io edo Kimono Labs. Merkatariek ezin dute erabili urruneko zerbitzuak LinkedInen segurtasun neurri sendoei esker. Hala eta guztiz ere, Lead Extractor erabiltzen hasi dira, profil publikoak barneratzeko. Tresna honek profila estekak, izenak eta helbide elektronikoak labaintzen ditu soilik. Baina Skype IDarekin, Yahoo Messenger IDarekin, helbide osoarekin eta erabiltzaile baten Twitter ID batekin lortu nahi baduzu, LinkedIn-ek ez dizu uzten.

3. Alibaba:

Alibaba enpresa-kontsumitzaileen zerbitzuak eskaintzen dituen konglomerazio teknologikoa da.Zoritxarrez, ez dago modurik webgune honetako datuak biltzeko. Amazonek eta eBayk ez bezala, Alibaba-k bere produktuei, irudiei, deskribapenei eta prezioei buruzko informazioa erauzteko zaildu du.2015ean Alibaba-ko datuek erraz grabatu ditzaketen tresna batzuk sartu ziren publikora. Tresna gehienak ordaintzen dira eta ez dira abioko itxaropenak sortu. Alibaba-k mundu osoko negozio ugari ditu eta hornitzaileekin erosleekin lotzen ditu. Bitartean, bere pribatutasuna bermatzen du eta ez die inor uzten datuak barneratzeko. 2017ko urritik aurrera, Alibaba-k 500 milioi erabiltzaile aktibo baino gehiago ditu bere plataforma osoan. Alibaba, hala nola, Amazon, Google eta Microsoft bezalako hodei-jokalari garrantzitsuenak gainditu ditu hodeien hazkundearen hazkundean. Hornitzaileen pribatutasuna bermatzeko estrategia onenak ezarri ditu eta segundotan IP helbide susmagarriak blokeatzen ditu.

December 22, 2017