От няколко часа безплатната услуга на google, Google Mail или Gmail, е недостъпна.
Някой има ли някаква информация на какво се дължи? Хакнали са ги? Ребилдват райд масиви?
Интересна статистика излезе като резултат от оптимизацията и изтриването на излишните текстове/линкове в alfarss.info.
AlfaRSS не е единственият агрегатор на rss канали, но е уникален по това, че не извежда повтарящи се новини. Роботите на AlfaRSS.Info проверяват всяка новина за предишна подобна, така елиминират в голяма степен повтарящото се съдържание и извеждат само уникални текстове. С времето алгоритъма откриващ дупликатите доста се разви и стана сравнително акуратен – над 95% от прекопирани текстове биват хващани. Разбира се има и такива, които преминават през алгоритъма, но те са твърде изменени, а робота все още не може да хваща семантиката на новини. За сега.
Днес реших да не губя излишно място на сървъра, на който е AlfaRSS и реших да затрия повтарящите се новини. Така или иначе те не се извеждат под никаква форма в сайта.
Статистиката сочи, че средно на всеки 3 секунди излиза новина, която не е оригинална, а е прекопирана едно към едно или е с много висок процент близка или казано направо: твърде съмнително близка. Такъв тъп новини не се извеждат на сайта, а се използват единствено за създаване на статистика за всеки източник. От тази статистика се виждат и няколко сайта, в които 2 от 3 новини са копирани от някъде… звучи ужасно, но е факт, че това не са никак малки сайтове!
*Крадена или копирана – към момента няма създаден автоматичен алгоритъм разпознаващ единия от другия вид.
Е, уверете се сами: http://jobs.bg/
Коментарите са излишни, а безумието огромно!
Горният линк е просто шега, но показва една сериозна дупка в сигурността на jobs.bg и възможността тя да бъде използва за CSS (cross site scripting), съответно това е начин някой недоброжелател да ви крадне информация от профила или изобщо да ви превземе профила, а от това следват доста други нежелани възможности.
Пускам този пост в подкрепа на Бого за изцепката на търновския ректор г-н Легкоступ.
Надявам се това да стигне до повече хора и простотията на редактора да не остане проспана…
Всеки, който се занимава с уеб програмиране често се сблъсква с проблемите на браузерите и най-вече, че няма еднакъв стандарт в очите на разработчиците на браузери. Самите разработчици на браузери понякога прекаляват – всякакви бози писани от разни уеб “мастери” се парсват и се изкарват в някакъв приличен формат за потребителя, но помага ли това?
Ето за пример сайта на правителството(провала) ни достига до нас гражданите с екстрата от 928 Errors, 12 warnings – за мен това си е чисто безумие! Причината за това е твърде сериозната толератност на браузерите.
Не познавам друг софтуер, които да смята грешките за нещо незначително, дори за нормално освен браузерите. Не трябва да е така!
Има едно доста лесно и елегатно решение на проблема. Необходимо е само от Google да го приемат присърце: страници, които не се валидират да бъдат избутвани назад в резултатите. Защо да го правят? Първо така ще стимулират много от мастерите и сеотата да валидират кода си, второ така от Г ще са сигурни, че посетителите им виждат това, което и уеб мастерите искат да им покажат;)
В крайна сметка печелим всички, тъй като това ще спомогне за по-бързото рендване на страниците, което пък е по-малко натоварване на компютрите ни, това води до п0-малко разходи на енергия и в крайна сметка намаляване на сметките за ток и парниковия ефект! Малко сложна връзка, но всъщност е съвсем реална:)