Archiv 6.2.2005 - 13.2.2005

mozdev.org - conkeror

Das nenne ich Aufopferung - n der Dokumentation zu einem rein tastenbedienten Mozilla:

You should never have to reach for your mouse. To make sure Conkeror remains pure, I do not own a mouse.

Wer also Maus-Phobiker ist, kann sich vielleicht mit dem Browser Erleichterung verschaffen.

Und weil ich ein experimentierfreudiges Kerlchen bin, hab ich das natürlich gleich mal ausprobiert. Ok, Emacs-Tastenbelegungen stinken (hey, ich bin VI-Man ) aber trotzdem ist das ganze durchaus benutzbar - man könnte sich dran gewöhnen, wenn denn die anderen Anwendungen im System eine ähnliche Bedienung hätten. Und noch ein Tipp für Mac-User: ja, das ganze funktioniert auch bei euch. Allerdings müsst ihr ja den Browser mit einem Parameter starten, der wird aber von Firefox.App nicht unterstützt. Statt dessen einfach folgendes Kommando im Terminal eintippen (Achtung, eine Zeile!): /Applications/Firefox.App/Contents/MacOS/firefox -chrome chrome://conkeror/content

Eventuell muss der Pfad zur Firefox.App angepasst werden. Danach geht ein kleines Fenster mit einer recht spartanisch gehaltenen Hilfedatei auf. Gut durchlesen, denn wenn man sich nicht wenigstens merkt wie man die Hilfeseite aufruft, wirds eng. Das grosse B geht zurück in der History, wenn ihr euch also vertüddelt, damit kommt ihr immer wieder zur Hilfe. Achja, und beenden geht nicht mit Apfel-Q - schliesslich ist es ja Emacs. Also die beiden Tasten Ctrl-X und C nacheinander drücken.

Wenn Suchmaschinenpromoter nix finden...

Und nochmal Logfiles

Da ich ja nun ein interessantes Studienobjekt hatte, wollte ich mal gucken inwieweit ich mit ein bischen Clusteranalyse in meinen Logfiles irgendwas interessantes zutagefördern würde. Ich habe also eine Matrix angelegt aus Referrern und zugreifenden IP-Adressen und mir damit mal einen Überblick über typische Userszenarien gemacht - also wie sehen normale User aus im Log, und wie sehen Referrer-Spammer aus und wie sieht unser Freund aus.

Alle drei Varianten lassen sich gut unterscheiden, auch wenn ich im Moment da noch eher davor zurückschrecken würde das algorithmisch zu fassen - das lässt sich nämlich alles recht gut simulieren. Trotzdem sind ein paar Auffälligkeiten zu sehen. Zuerst mal ein ganz normaler Benutzer:


aa.bb.cc.dd: 7 Zugriffe, 2005-02-05 03:01:45.00 - 2005-02-04 16:18:09.00
 0065*-
 0001*http://www.tagesschau.de/aktuell/meldungen/0,1185,OID4031994 ...
 0001*http://www.tagesschau.de/aktuell/meldungen/0,1185,OID4031612 ...
 0001*http://mudbomb.com/archives/2005/02/02/wysiwyg-plugin-for-wo ...
 0001*http://www.heise.de/newsticker/meldung/55992
 0001*http://log.netbib.de/archives/2005/02/04/nzz-online-archiv-n ...
 0001*http://www.heise.de/newsticker/meldung/56000
 0001*http://a.wholelottanothing.org/2005/02/no_one_can_have.html

Man sieht schön wie dieser User von meinem Weblog weggeklickt hat und wieder zurückgekommen ist - die Referrer sind nämlich mitnichten alles Links auf mich, sondern falsche Referrer die die Browser schicken, wenn der Benutzer von einer Site auf eine andere wechselt. Eigentlich sollen Referrer ja nur dann geschickt werden, wenn auch wirklich ein Link geklickt wird - kaum ein Browser macht das aber richtig. Der Besuch war an einem definierten Tag und er ist direkt eingestiegen durch Eingabe des Domainnamens (die "-" Referrer stehen oben und oben steht der früheste Referrer der vorkommt).

Oder hier mal ein Zugriff von mir:


aa.bb.cc.dd: 6 Zugriffe, 2005-02-04 01:11:56.00 - 2005-02-03 08:27:09.00
 0045*-
 0001*http://www.aylwardfamily.com/content/tbping.asp
 0001*http://temboz.rfc1437.de/view
 0001*http://web.morons.org/article.jsp?sectionid=1&id=5947
 0001*http://www.tagesschau.de/aktuell/meldungen/0,1185,OID4029220 ...
 0001*http://sport.ard.de/sp/fussball/news200502/03/bvb_verpfaende ...
 0001*http://www.cadenhead.org/workbench/entry/2005/02/03.html

Ich erkenne mich daran, das Referrer mit temboz.rfc1437.de vorkommen - das ist mein Online-Aggregator. Sieht ähnlich aus - ne Menge falsch geschickter Referrer. Noch ein anderer User:


aa.bb.cc.dd: 19 Zugriffe, 2005-02-12 14:45:35.00 - 2005-01-31 14:17:07.00
 0015*http://www.muensterland.org/system/weblogUpdates.py
 0002*-
 0001*http://www.google.com/search?q=cocoa+openmcl&ie=UTF-8&oe=UTF ...
 0001*http://blog.schockwellenreiter.de/8136
 0001*http://www.google.com/search?q=%22Rainer+Joswig%22&ie=UTF-8& ...
 0001*http://www.google.com/search?q=IDEKit&hl=de&lr=&c2coff=1&sta ...

Dieser kam öfter (also mehrere Tage) über meine Update-Seite auf muensterland.org und zusätzlich hat er noch nach Lisp-Themen gesucht. Und vom Herrn der Schockwelle ist er auch mal gekommen. Absolut typisches Verhalten.

Jetzt mal im Vergleich ein typischer Referrer-Spammer:


aa.bb.cc.dd 6 Zugriffe, 2005-02-12 17:27:27.00 - 2005-02-02 09:25:22.00
 0002*http://tramadol.freakycheats.com/
 0001*http://diet-pills.ronnieazza.com/
 0001*http://phentermine.psxtreme.com/
 0001*http://free-online-poker.yelucie.com/
 0001*http://poker-games.psxtreme.com/

Alle Referrer sind direkte Domain-Referrer. Keine "-" Referrer - also keine Zugriffe ohne Referrer. Keine sonstigen Zugriffe - würde ich es genauer analysieren nach Seitentyp, würde auffallen das keine Bilder etc. zugegriffen werden. Leicht zu erkennen - sieht einfach mager aus. Typisch ist auch das jede URL nur einmal oder zweimal angegeben ist.

Jetzt unser neuer Freund:


aa.bb.cc.dd: 100 Zugriffe, 2005-02-13 15:06:16.00 - 2005-02-11 07:07:55.00
 0039*-
 0030*http://irish.typepad.com
 0015*http://www208.pair.com
 0015*http://blogs.salon.com
 0015*http://hfilesreviewer.f2o.org
 0015*http://betas.intercom.net
 0005*http://vowe.net
 0005*http://spleenville.com

Was auffällt sind die Referrer ohne abschliessenden / - untypisch für Referrer-Spam. Ausserdem halt ganz normale Sites. Was auch auffällt, es werden Seiten zugegriffen ohne Referrer - dahinter verstecken sich die RSS-Feeds. Auch dieser ist also leicht von Usern zu unterscheiden. Vor allem da ein gewisser Rhythmus drin ist - scheinbar immer 15 Zugriffe mit einem Referrer, dann den Referrer wechseln. Entweder ist die Referrer-Liste recht klein, oder ich hatte Glück das er zweimal den gleichen bei mir probiert hat - einer ist nämlich 30x da.

Normale Bots braucht man nicht gross zu vergleichen - die wenigsten schicken Referrer mit und sind deshalb völlig uninteressant. Ich hatte einen, der mir aufgefallen war:


aa.bb.cc.dd: 5 Zugriffe, 2005-02-13 15:21:26.00 - 2005-01-31 01:01:07.00
 2612*-
 0003*http://www.everyfeed.com/admin/new_site_validation.php?site= ...
 0002*http://www.everyfeed.com/admin/new_site_validation.php?site= ...

Eine neue Suchmaschine für Feeds die ich noch nicht kannte. Scheinbar hat der Admin gerade vorher irgendwo meine Adresse eingetragen und dann hat der Bot losgelegt die Seiten zu sammeln. Danach hat er dann im Administrationsinterface meine von ihm neu gefundenen Feeds freigeschaltet. Scheint ein kleines System zu sein - der Bot läuft von der gleichen IP wie das Administrationsinterface. Die meisten anderen Bots kommen von ganzen Botfarmen, Webspidern ist halt eine aufwändige Sache ...

Zusammenfassend lässt sich also feststellen, das die derzeitige Generation von Referrer-Spammer-Bots und anderen Mal-Bots noch recht primitiv aufgebaut ist. Sie benutzen keine Botnetze um viele unterschiedliche Adressen zu verwenden und sich dadurch zu verstecken, sie benutzen reine Server-URLs statt Seiten-URLs und haben auch sonst recht viele typische Kennzeichen wie z.B. bestimmte Rhythmen. Ausserdem kommen sie fast immer mehrfach.

Leider sind das keine guten Merkmale um sie algorithmisch zu fassen - ausser man lässt seine Referrer in eine SQL-Datenbank laufen und prüft jeden Referrer mit entsprechenden Selects auf die typischen Kriterien. Darüber könnte man dann durchaus die üblichen Verdächtigen erwischen und gleich auf dem Server blocken. Denn normale User-Zugriffe sehen deutlich anders aus.

Allerdings sind auch schon neue Generationen in der Mache - wie mein kleiner Freund, der mit dem fehlenden /, zeigt. Und dank der dämlichen Browser mit ihren falsch erzeugten Referrern (die viel mehr über die History des Browsers aussagen als über tatsächliche Link-Verfolgung) kann man nicht einfach die referenzierten Seiten gegenchecken, da viele Referrer reine Blindreferrer sind.

vermutlich verkleideter Bot in den Logs

Ich hab gerade mal in meinen Referrern einige Referrer gefunden, auf denen ich absolut nichts finden konnte das auf mich verweist. Soweit nichts ungewöhnlich - Referrer-Spam wäre die erste Vermutung. Aber die in den Referrern genannten Seiten sind ganz normale Weblogs und andere Sites - keine Leute die Grund hätten für ihre Site zu spammen (zum Beispiel ein Blog mit ca. 1 Post pro Monat, oder eine Irin und noch so ein paar seltsame Referrer). Auch sind die Anzahlen anders als bei normalem Referrer-Spam: der kommt normalerweise entweder nur 1-2x oder wenn dann mit vielen Adressen und jede dann gleich 100x oder ähnliches. Dieser kommt ca. 15 mal.

Also habe ich mal in den Logs etwas gewühlt, ob ich da was finde. Und siehe da, die Referrer haben ungwöhnliche Merkmale: sie schliessen nicht mit einem / ab. Normalerweise wird eine Adresse die nicht auf / endet automatisch umgeleitet auf die /-Variante. Referrer sind also normaleweise /-terminiert oder direkte HTML-Seiten oder etwas vergleichbares. Reine Site-Angaben ohne / hinten dran sind eher selten.

Auch noch was anderes fällt auf: die Seiten wurden wirklich angesurft - bzw. mindestens runtergeladen. Und die zu einem Referrer gehörigen Seiten sind recht wild gewürfelt - bei normalen Usern erwartet man eigentlich eher irgendeine Form von Konsistenz in dem was per Referrer rüberkommt. Vor allem kommen selten 15 Links auf einen Schlag auf eine Seite ...

Und das wesentliche Kriterium: die IP des zugreifenden Rechners ist bei den verschiedenen immer die gleiche. Eine Auswertung ergab dann folgendes Bild:


 15 betas.intercom.net
 15 blogs.salon.com
 15 hfilesreviewer.f2o.org
 30 irish.typepad.com
 5 spleenville.com
 5 vowe.net
 15 www208.pair.com

Alles eindeutig falsche Referrer. Zusätzlich noch 34 Zugriffe auf meine RSS-Feeds ohne Referrer. Zugriffe waren nur auf direkte Postings und RSS-Feeds - nicht auf Übersichtsseiten oder Archivseiten. Sieht sehr danach aus, das der Bot hier wie folgt vorgehen: RSS-Feeds suchen, diese abgreifen, da drin dann nach Permalinks auf Artikel suchen und diese runterziehen um z.B. an die Kommentarformulare zu kommen. Das ganze schön getarnt als angebliche Besucher, inkl. gefälschten Referrern die unverdächtig wirken. Auch nicht zu viele zugriffe eines Referrers, lieber das ganze öfter gewechselt.

Eigentlich nichts neues, beim eMail-Spam sind ja gefälschte echte Absender durchaus üblich und gängig um schwerer zu filtern zu sein. Aber bei Sammelbots sehe ich diese Art der Mimikry zum ersten Mal life - die Symptome beobachte ich auch erst ca. 1-2 Wochen bei mir.

Für Admins ist das ganze natürlich ziemlich nervig, da man die Referrer-Logs noch weniger gebrauchen kann als bisher schon. Bisheriger Referrer-Spam war zwar ein Ärgernis, aber aufgrund der ziemlich dämlichen Namen der Referrer leicht zu erkennen. Diese Form von Logphänomen verfälscht auch die Referrer - fällt aber wesentlich weniger auf. Könnte für Weblogs interessant sein die ihre Referrer direkt im Beitrag anzeigen.

Und natürlich bleibt auch noch das Problem, das ich ja noch nicht weiss was der Bot mit den gesammelten Erkenntnissen anfangen will. Wobei ich stark auf Spam tippe, aber das ist nur eine Vermutung - könnte auch ein Bot sein, der nach typischen Sicherheitslöchern sucht. Auf jeden Fall ist es ein Bot und auf jeden Fall hat er nichts gutes vor - denn sonst bräuchte er sich nicht zu verstecken.

Was guckst du?

Ein Reposting eines alten Bildes aus 2002 - in der Nähe von Husum. Ich spiele gerade mit meinem neuen Photo-Plugin für WordPress rum und brauchte Testmaterial.

Passend zu meinem vorigen, längeren, Text: Weblog Tools Collection leidet unter Referer Spam DoS. Solche Vögel - also Referrer-Spammer die in die Tausenden gehen bei den Zugriffen - sind in meiner Loganalyse (noch?) nicht aufgetaucht.

Wie man CSS DropShadows erzeugt. Könnte ich mir für meine Fotos vorstellen. Zickt aber rum bei IE 5.5 für Mac OS X. Ausserdem sind DropShadows eh nur was für Warmduscher und Weichspühler

DGB-Chef akzeptiert Umbau des Sozialstaats

DGB Chef akzeptiert Umbau des Sozialstaats und macht damit die Gewerkschaften obsolet. Hier hatte ich einen längeren Text geschrieben, aber irgendwie hab ich nach meiner aktuellen Inhaltsvernichtung den nicht mehr parat. Wenn jemand den noch im RSS-Reader stecken hat, bitte melden, ansonsten ist er halt futsch.

Neue Polaroid 600 SE

Ich hab mir eine neue Polaroid 600 SE gekönnt. Meine alte ist ja sehr lädiert - halt vom Grabbeltisch, defekter Drahtauslöser, Macken, Dellen etc. Die neue ist wie aus dem Ei gepellt. Und es war sogar noch das 127er dabei, das mir ja bisher fehlte. Nette Optik, vor allem eine wesentlich sinnvollere Nahgrenze als beim 150er. Und das Ergebnis kann sich auch sehen lassen - ich mag einfach Polaroids. Allerdings war mein Scanner nach langer Nicht-Benutzung ziemlich verstaubt und natürlich war der Staub nicht plötzlich von ein paar mal wischen weg. Im Ergebnis waren also haufenweise Staubfädchen zu sehen. Naja, Photoshop und das Polaroid Dust&Scratch Removal Plugin haben das Bild weitestgehend gerettet. Allerdings mache ich mir die Polaroids sowieso normalerweise nicht zum Scannen, sondern fürs Fotoalbum. So richtig altmodisch, mit Pappblättern, Pergament-Deckblättern und so …

Nicht über den Inhalt meines Weblogs wundern ...

... da ist nur ein amoklaufender Admin mit einem saublöden Script drübergedengelt und hat alle Inhalte vernichtet. Wird irgendwie alles wieder rekonstruiert und repariert und gebügelt und gefaltet. Irgendwie. Und danach stell ich mich in die Ecke und geissel mich ...

Update: jetzt ist alles wieder weitestgehend restauriert. Was war passiert: ich habe von Exhibit für die Bilder auf ein eigenes Plugin umgestellt. Und dabei halt per Script alle Postings mit Bildereinträgen umgeschrieben. Bei dem generierten UPDATE habe ich aber dummerweise die WHERE-Klausel vergessen ...

Verluste: mein Posting zum DGB und die Formulierungen in den Postings von heute. Alles andere war aus einem Backup zu rekonstruieren. Und ein paar Nerven. Und mir zum x-ten Mal hinter die Ohren geschrieben, das ich demnächst vor der Bastelei einen aktuellen Backup machen sollte. Was natürlich nix nutzen wird, weil hinter den Ohren kann ich ohne zwei Spiegel nicht lesen ...

Update 2: und natürlich war ich so klasse bei der Rekonstruktion des Weblogs die geänderten Bilderpostings auch zu überschreiben, weshalb jetzt sämtliche Beiträge im Bilderblog ohne Fotos sind. Ich fasse es nicht. Irgendwie ist heute Vollmond oder sowas ...

Was bedeutet, das ich noch mal kreativ werden muss, um die Bilder wieder in die Postings zurückzupulen, denn natürlich habe ich mir die Zuordnungstabellen alle gelöscht, da ich diese ja nicht mehr brauche. Aber die hab ich ja alle noch im Backup, so schlimm wie vorher wirds also nicht

Update 3: jetzt sollte alles wieder weitestgehend so sein wie vorher. Und die letzte Reparatur ging tatsächlich ohne grössere Katastrophen von statten

Was einen erwartet wenn man MySQL 4.0 auf 4.1 aktualisiert. Ok, Datenbankversionsupgrades sind nie einfach und können immer mal Probleme machen.

WordPress Localization beschreibt wie man eigene Übersetzungen für WordPress erstellt.

Anrufbeantworter nehmen R-Gespräche an. Schnell mal meinen Anrufbeantworterspruch checken ...

Microsoft Interoperability

Ian Bicking beschreibt was Microsoft Interoperability wirklich heisst. Ein Zitat des Support-Mitarbeiters von Microsoft:

Microsoft isn't in the business of integrating with non-Microsoft software.

Schilys neue Initiative für Flüchtlingslager in Afrika

Schilys neue Initiative für Flüchtlingslager in Afrika - Kommentare dazu verkneife ich mir jetzt mal, da vermutlich die meisten davon zu einer Beleidigungsklage führen könnten

Schwere Zeiten für Kofi Annan - durch Schmutzkampagnen und Verleugnungen aus Richtung der konservativen NGOs in den Staaten. Aber auch andere werfen fleissig mit Dreck.

Deep Links finden in Logfiles

Weil mich der Pepino gerade danach fragte hab ich mal mein Deep Link Finder Script online gestellt. Es ist ein einfaches Python Script. Sollte ab Python 2.2 laufen, möglicherweise sogar mit Python 2.1 (ist aber nicht getestet). Das Script wird im Source konfiguriert (ich hab Kommentare dazu geschrieben) und dann einfach mit mehreren Logfiles als Parameter aufgerufen. Es sammelt aus Apache Combined Logs raus welche Sites wie oft auf angegebene Dateitypen (konfigurierbar, eingestellt sind einige Bildertypen) deep linked. Es spuckt dazu ein HTML Fragment raus das man mit Header und Footer garnieren kann um es online zu stellen - zum Beispiel entstehen so meine Zeitgeist-Seite für Deep Links. Die anderen Seiten haben ähnlich aufgebaute Scripte, nur das halt Suchbegriffe und generelle Referrer eingesammelt werden.

Ich guck mir ab und an die Deep Linker Liste an und wenn dann da jemand auftaucht der recht viel deep linkt und kein Aggregator oder News-Service ist, dann kriegt derjenige ein entsprechendes Austauschbild vorgesetzt. Aber eben auch wirklich nur diese Sites. Mich stört das nämlich auch immer wenn mir in meinem Feedreader unterstellt wird ich sei ein Bilderdieb oder Traffic-Räuber

Mach mir den Ackermann

Hotel Falckenstein: Mach mir den Ackermann - und womit? Mit Recht! Diese Oberabzocker auch noch zum Honorarprofessor für Wirtschaftswissenschaften an der Frankfurter Goethe-Universität zu machen ist einfach nur eine Frechheit.

Podcasts? Nö.

Weiteres zu Drupal

Was mir bei meinen Spielereien mit Drupal noch aufgefallen ist: im Unterschied zu WordPress ist das Datenbankmodell recht komplex. WordPress ist ziemlich stumpf - einfach ein paar Tabellen mit Daten drin, das meiste recht straight forward. Wenn man was ändern will kann man jederzeit auf SQL Ebene damit rumwurschteln und z.B. Importscripte, Reparaturscripte etc. schreiben. Alles wird immer on the fly ermittelt - Zähler, Listen etc.

Drupal hingegen benutzt recht aufwändige Caching-Mechanismen in der Datenbank. Auch Sachen aus dem Filesystem werden gecached. Dadurch hat man mit kleinen Scripten höheren Aufwand, da man wesentlich mehr Stellen berücksichtigen muss - mindestens den Cache beseitigen, damit er rekonstruiert wird. Auch ist das Datenmodell wesentlich stärker ausnormalisiert. Das ist natürlich gut vom Design her - aber für kleine Scripte natürlich aufwändiger, da man an mehr Stellen anpacken muss.

Das ist jetzt keine Wertung, nur eine Beobachtung - beides hat Vor- und Nachteile. Die Vorteile des Drupal-Ansatzes scheinen sich in der Performance zu zeigen, die nicht nur wegen der etwas aufgeräumteren PHP-Struktur etwas besser als die von WordPress scheint (wobei ich da keine harten Zahlen habe - erst brauche ich ein brauchbares Import-Script für meine Postings um mit gleichen Ansätzen zu arbeiten).

Was mir noch aufgefallen ist: die PostgreSQL-Unterstützung (ja, ich habs jetzt endlich laufen!) in Drupal ist definitiv hinter der von MySQL zurück. Zum Teil gibts mit PostgreSQL Fehlermeldungen die mit MySQL nicht auftreten. Zum Beispiel beim Passwort-Wechsel gabs Probleme weil ein nicht existentes Feld angesprochen wurde. Oder bei der Übersicht der im Newsreader abonnierten Quellen gabs ne Meldung weil ein nicht-aggregiertes Feld eines komplexen SELECTs nicht als Gruppierungsfeld aufgeführt wurde. Oder beim ersten Zugriff, wo für das Feld uid in der Tabelle sessions kein Wert angegeben wurde, obwohl es als NOT NULL deklariert ist. PostgreSQL ist halt deutlich pingeliger als der Karteikasten. Mit PostgreSQL wird man definitiv Hand an den PHP-Code legen müssen. Mal schauen, wenn ich fertig bin mache ich vielleicht mal einen Patch fertig, der diese Probleme behebt. Bis jetzt sinds nur Kleinigkeiten, die aber für Nicht-Programmierer durchaus eine Hürde darstellen können. Zum Teil basieren die aber sicherlich auch auf den etwas älteren Versionen aus der Debian Stable (z.B. ist das PgSQL API in PHP in neueren Versionen deutlich anders benannt als in der 4.1.2).

Wordpress Dateien und Ladereihenfolge

Wordpress file loading beschreibt in welcher Reihenfolge welche PHP-Files von WordPress geladen werden um eine Blogseite zu produzieren. Ganz interessant wenn man plant was zu verändern an Dateien - es gibt eine erste Orientierung wo man was finden könnte. Was allerdings auch auffällt: dafür das WordPress eigentlich recht schlanke Seiten produziert hat WordPress selber schon ganz schön Speck auf den Hüften

Wordpress to Drupal Migration Script

Wordpress to Drupal Migration Script - kann aber im Moment wohl nur von Karteikasten nach Karteikasten migrieren - eine richtige Datenbank als Ziel muss man ihm unter Umständen erst beipulen.

Update: naja, das Script macht wirklich nur die Übertragung der Postings. Keine Post-Slugs (also kein Erhalt der URLs), keine Kategorien, nix. Kann man vielleicht benutzen wenn man nur ein sehr einfaches WP-Blog hatte, aber ansonsten ist es doch arg mager. Und bei grossen Blogs fliegt es einem nach einer Weile mit einem Fehler um die Ohren - der erlaubte Speicher ist erschöpft. Denn PHP benutzt von der Kommandozeile die Einstellungen für das CGI - und auch da ist der Speicherbedarf begrenzt. Dazu kommt dann noch, das es keinerlei Duplikateerkennung hat und deshalb lustig beim zweiten Lauf alles nochmal importiert.

Klingt so als ob ich mir da wohl doch was eigenes schreiben müsste, wenn ich das ganze mal ernsthaft ausprobieren wollte.

wp-style-switcher ist ein simpler CSS-Switcher für WordPress der ohne JavaScript oder ähnliches auskommt.

Arbeitgeber wollen neue Studienfinanzierung

Arbeitgeber wollen neue Studienfinanzierung - eigentlich gehe ich ja davon aus das diejenigen die etwas ändern wollen entweder direkt dieses Etwas verwalten, oder zumindestens bereit sind es demnächst zu finanzieren. Sprich: wenn die Arbeitgeber die Studienfinanzierung ändern wollen, sollen sie zu erst mal die Studienfinanzierung, Kindergeld etc. auch bezahlen. Denn so ist das nur hohles Phrasendreschen - die Arbeitgeber haben mit den genannten Sachen nämlich nix zu tun und schreien nur mal wieder populistisch was in die Runde.

Ist doch wirklich faszinieren wie sie Zahlungen die sie selber nicht leisten reglementieren wollen und dazu dann ein Kreditinstitut einsetzen wollen, das sie nicht finanzieren. Hätte Hundt was davon gesagt das die Arbeitgeber eine Sozialkasse zur Stützung der Studienfinanzierung einrichten und bestücken, dann wäre das ein innovativer Vorschlag gewesen. So ist es nur Blah-Blah.

Unsere Arbeitgeberverbände sind halt wirklich auf den Hund gekommen.

Buffer Overflow in zahlreichen Produkten von Symantec - Autsch!

China: Hinrichtungen für den sozialen Frieden? - wird sicherlich die Begeisterung unseres Industriekanzlers für den grossen chinesischen Markt nicht gross dämpfen ...

Google-Suche: gemölter

Ich wollte nur mal drauf hinweisen das ich bei der Suche nach gemölter bei google.de auf dem ersten Platz bin

HP-Chefin tritt überraschend zurück

In Parton wurde ein Mini-Loch-Ness-Monster angeschwemmt. Und jetzt rätseln sie was es eigentlich für ein Viech sein könnte.

liquid design auf em/ex Basis

Aus dem CSS Zen Garden: ein liquid Design das sich an em und ex orientiert und deshalb im Layout mit einer geänderten Fontgrösse mitwächst und schrumpft. Das wäre eventuell eine brauchbare Basis für mein Blog, denn gerade die Tatsache das ein fixed Design bei Fontgrössenänderung nicht sonderlich stabil reagiert stört mich an Kubrick.

Jetzt muss ich nur noch rauskriegen wie ich das vernünftig umsetze. Vor allem die Kopfgrafik muss ich dann wohl deutlich anders einbringen - Bilder wachsen ja nunmal nicht sinnvoll mit. Mal schauen ob ich irgendwann Lust zum Basteln finde.

Wer hat Schuld am braunen Mann?

Wann, wenn nicht jetzt will die Union diese an, nein, über den rechten Rand der Vernunft und Humanität in die Nazischeiße geratenen Schäfchen denn wieder einfangen? Sachlicher ausgedrückt: was macht die bürgerliche Opposition derzeit für die von der Regierung Enttäuschten derart abschreckend, dass sie lieber hergelaufenen Verbrechern und ewig Gestrigen nachlaufen? Das ist die große politische Frage der Gegenwart, viel wichtiger als jene, ob man Parteien wie NPD oder DVU verbieten sollte oder nicht.

Chefvolkswirt Walter liest Deutschen die Leviten

Chefvolkswirt Walter liest Deutschen die Leviten - ach ja, wenn die Schergen der Geldsäcke jammern ist es Analyse und angeblich konstruktive Kritik. Was dann hinten rauskommt - worauf es ja, wie wir seit Kohl alle wissen, ankommt - ist nur Scheisse. Aber was wird man schon vom Chefvolkswirt eines der grössten Abzockunternehmen (wir erinnern uns: die haben gerade trotz Rekordabschluss einen Abbau von ein paar tausend Mitarbeitern geplant - was sicherlich der Volkswirtschaft ganz doll gut tun wird) anderes erwarten.

zorniges Gesicht

Die arme Filmindustrie und die Bagetellgrenze

Filmindustrie macht gegen "Raubkopierer-Klausel" mobil - wenn ich mir das geheule so ansehe, dann vergeht mir sowieso schon mal wieder die Lust auf Filme. Ins Kino geh ich eh kaum noch seit es nur noch die Monsterkinos gibt, in denen man sich ungefähr so gemütlich fühlt wie in der Bahnhofsvorhalle. Und auf DVD - sorry, aber was soll ich mit Filmen, die mich im Heimkino dann mit 15 Minuten Werbung für anderen Filme-Schrott den ich nicht will - und wollte ich ihn, dann hätte ich ihn wohl schon längst - malträtieren?

Statt sich mal Gedanken zu machen wie man sinnvoll auf moderne Techniken reagiert macht sich die Filmindustrie lieber Gedanken darüber, wie sie ein überholtes Denkmodell weiter zementieren kann. Und schreit nach Hilfe durch den Staat. Was für eine Moppelkotze.

Don't reset existing password on request, prevent DoS password reset abuse | drupal.org

Don't reset existing password on request, prevent DoS password reset abuse - tja, genau das Problem hab ich auch bemerkt und konnte nicht fassen das tatsächlich jemand sowas in ein CMS eingebaut hat. Man kann in Drupal für einen Benutzer das Passwort wechseln - und zwar für jeden. Das neue Passwort wird dann diesem Benutzer per Mail zugeschickt. Man kann also darüber keinen illegalen Zugriff erlangen, ausser man kann die Mails des Benutzers abfangen (was in der Regel wohl hoffentlich nicht der Fall sein wird). Aber man kann einen Admin aussperren: einfach einen Job aufsetzen der minütlich das Passwort des Admins zurücksetzt. Und dann diese zwangsweise Abwesenheit des Admins dazu nutzen um das Drupal vollzuspammen zum Beispiel.

Sowas ist wirklich ein peinlicher Patzer. Wird leider viel zu gerne und viel zu häufig gemacht. Wer also Drupal betreibt, dem sei der Patch empfohlen (aufpassen, der Autor hat zwei Patches reingereicht, der erste war noch buggy). Liess sich problemlos installieren und behebt zumindestens die Aussperrung des Admins. Nervige Mails kriegt man natürlich trotzdem dabei.

Firefox - IDN - 0 Info - 0 Transparenz

Kai schimpt über Firefox - IDN - 0 Info - 0 Transparenz - und er hat Recht mit seinem Rant. Von kommerziellen Providern ist man ja dieses Security-Gemauschel gewöhnt, aber bei Open-Source-Projekten nervt es mich auch jedes Mal ganz besonders. Wann kapieren die Leute endlich mal das nur eine frühe Disclosure den Usern überhaupt die Chance gibt sich zu sichern? Geheimhaltung von Fehlern basiert auf der absurden Annahme das man der erste sei der diesen Fehler bemerkt hat. Was schlicht albern ist: ein Blackhat der diesen Fehler bemerkt wird ganz sicher nichts an die grosse Glocke hängen sondern diesen Fehler so lange wie möglich ausnutzen. Und damit profitiert von einer zu langen Geheimhaltung nur derjenige, dem man nicht helfen sollte.

Im Fokus der Überlegungen rund um Security muss der Benutzer stehen - und zwar der mündige Benutzer, der in der Lage ist die Informationen in sinnvolles Handeln umzusetzen. Den unmündigen Benutzer scherts eh nicht, der klickt auf alles. Aber ein Sysadmin der ein Problem kennt kann zumindestens durch eigene Aufklärung seiner User dazu beitragen das diese vielleicht für eine gewisse Zeit etwas vorsichtiger sind. Ein nicht informierter Sysadmin hat dazu nicht mal die Spur einer Chance.

Gen-Pflanzen Forschung in Münster

Die Uni hat ein Gewächshaus zur Forschung an gentechnisch veränderten Pflanzen gebaut. Ich kann irgendwie nicht behaupten das ich da sonderlich begeistert von bin, das es in der Nachbarschaft steht. Nicht unbedingt wegen des Gewächshauses - aber wo ein Gewächshaus ist, will irgendwann auch jemand Freilandversuche machen.

verwirrtes Gesicht

Jupp, Drupal will mich in den Wahnsinn treiben

Ganz eindeutig. Ich weiss nicht was es gegen mich hat, aber es hasst mich heute. Ganz massiv.

Ich hab mir das kubrick-Theme einfach unter einen eigenen Namen kopiert, damit ich es anpassen kann ohne das Kubrick-Theme selber zu ändern. Witzigerweise benutzt es jetzt aber nicht mehr die phptemplate-Engine. Oder genauer: der Eintrag in der Tabelle system (type='theme' und dann für das page.tpl.php) zeigt nicht auf phptemplate.engine, sondern auf phptemplate - das .engine fehlt. Wenn ich es per Update anhänge, funktioniert das genau ein mal. Danach wird dieser Eintrag in der Tabelle system überschrieben und .engine ist futsch und das Template kaputt. Mit Kubrick tuts das natürlich alles. Und natürlich findet man nirgendwo eine Info wo verflixt nochmal das Theme sagt welche Template-Engine benutzt werden soll - und wie dieser Eintrag in der Tabelle system entsteht. Nein, so einfach nach phptemplate.engine grepen bringt nix.

Ok, mir ist jetzt klar das die Engine die Einträge erzeugt - jedenfalls nachdem ich mir den Source zur Engine mal näher angeguckt habe. Da wird nach page.tpl.php gesucht und wenn das gefunden wird, wird mit der phptemplate.engine verbunden. Aber warum sollte die Engine ihren eigenen Namen falsch eintragen? Zumal sie es bei Kubrick ja richtig macht. Das hab ich ja auch einfach nur ausgepackt in das themes-Verzeichnis.

Jut, also weiter forschen. Ein grep -r auf INSERT in Kombination mit system findet dann im system.module die Funktion system_obtain theme info, in der diese Sätze geschrieben werden. Aber wie und wo genau da jetzt was damit gemacht wird - sorry, aber das findet man nicht raus ohne längeres Studium. Irgendwie wird das description Attribut mit einem Wert gefüllt der beim Kubrick-Theme mit .engine endet und bei allen anderen nicht. Kubrick referenziert die Theme-Engine exakt und korrekt, aber eine beliebig benamste Kopie von Kubrick mit identischem Inhalt referenziert eine Theme-Engine ohne .engine im Namen und tuts nicht. Toll. Aber Kubrick umbenennen funktioniert. Hä?

Ok, nächster Ansatz. Mein Template umbenennen in was anderes und Kubrick umbenennen in meinen eigentlich gewünschten Namen. Verwirrung komplett: mein Template tut nicht, aber das jetzt kubrick heissende und vorher nicht funktionierende tut jetzt auch nicht. Äh .. Also das Kubrick in was anderes umbenannt. Und mal mein zwischengelagertes ausprobiert. Das tuts jetzt. Unter einem Namen der nicht Kubrick ist. Hä? Hütchenspiel? Benenne jetzt die Themes so lange um bis ich irgendwann unter dem von mir gewünschten Namen ein funktionierendes habe und dann ist gut?

Also mal versucht das Hütchenspiel aufzulösen. Computer sind doch deterministische Kisten, das muss doch gehen. Ok, beide Templates (originales Kubrick und mein Hugo) umbenannt. In aa und bb. Und welches funktioniert? Das was bb heisst. Nochmal das ganze, nur jetzt die Rollen vertauscht. aa wird bbb und bb wird aaa. Welches funktionert jetzt? Das was "bbb" heisst. Wenn zwei phptemplate.engine basierte Themes im System installiert sind, funktioniert nur das zuletzt im System gefundene zum Zeitpunkt wo nach den Themes gesucht wird. Die anderen gehen kaputt.

Also muss ich jetzt erstmal rauskriegen was eigentlich mit den alten Themes los ist, warum die nicht zum Funktionieren zu kriegen sind. Erster Ansatz: einen Dump der Datenbank machen und mit grep gucken wo überall meine Freunde auftauchen. Dabei hab ich dann gleich gefunden was mit dem ominösen phptemplate ohne .engine ist: die entsprechenden Einträge enthalten statt des Punktes einen chr(0). Ascii-Null. Wird von MySQL zwar gespeichert, aber von PHP wohl abgeschnitten beim Zugriff. Und für die ganzen alten Templates sind diese ganzen kaputten Einträge da. Ausserdem hat sich noch die engine im Eintrag phptemplate extra templates in der Tabelle variable gemerkt welche Themes sie schon gesehen hat.

Noch mal ein clean room Test: die Einträge in der Tabelle system mit type='theme' und description like 'themes/engine/phptemplate%' rauswerfen. Dann weiss er nix mehr von den Themes und ihren Namen. Dann nur mein gewünschtes Template haben und dieses dann aktivieren. Und siehe da, es funktioniert auf Anhieb. Dann mal kubrick ausgepackt. Und es funktioniert. Danach tuts aber mein eigenes Theme nicht mehr. Wie erwartet - kubrick kommt im Alphabet nach hugo. Kubrick wieder löschen und schon tuts mein eigenes Theme wieder - nach entsprechendem Refresh.

Also nachforschen wo zum Kuckuck diese Geschichte passiert und wieso. Es passiert ja nur mit den phptemplate.engine Themes. Die xtemplate.engine Themes tuns ja problemlos. Wobei sich herausstellt das die es trotz des Bugs tun - er betrifft sie auch. Denn im system.module in system_theme data (wie ich das rausgefunden habe erspare ich den Lesern mal - es war einfach sukzessives Einsetzen von echo Befehlen um zu gucken wann wo was kaputt geht) wird im letzten Schritt - im Aufruf von system obtain theme info - an den Files das description-Element zerstört. Und das ist es, das in die Systemtabelle gespeichert wird um auf die Theme-Engine zu referenzieren. Nur das letzte Theme einer Engine behält den korrekten Eintrag, alle anderen sind kaputt.

Hmm. Der basename-Aufruf in Zeile 336 ist der einzige Kandidat - er liefert eigentlich nur die Theme-Engine ohne das .engine hinten dran raus. Aber er sollte das eigentliche Feld nicht verändern, deshalb hatte ich ihn vorher nicht sonderlich beachtet - die PHP-Doku sagt nix über Seiteneffekte dieser Funktion. Aber wenn ich den Eintrag auskommentiere, funktinioniert mein Theme und Kubrick auch - gleichzeitig. Im PHP Handbuch steht aber nix davon, das basename den ursprünglichen String verändert.

Also ein kleines Testscript geschrieben, das nur einen basename-Aufruf macht. Örks. Ja, das ist es - basename verändert den Ursprungsstring, und zwar haut es einen chr(0) anstelle des Punktes rein. Und siehe da, es gibt einen Bugreport aus 2002 dazu - ja, ich hab ne alte PHP 4.1.2 Version laufen, da Debian Stable. Beim Bugreport steht eine brauchbare Lösung für mein Problem - einfach die Variable in "" setzen und so mit String-Interpolation arbeiten. Und siehe da, Problem gelöst. Und Knoten ins Ohr machen: bei 4.1.2 macht basename die Quellvariable kaputt.

Und mit so einem Scheiss (damit mein ich den Bug, nicht Drupal) beschäftigt sich ein Programmierer beim Debugging

Ich hätte auch einen anständigen Job erlernen können. Whisky-Fass-Bewacher bei Jack-Daniels zum Beispiel ...

Manche Projekte wollen mich in den Wahnsinn treiben

oder so könnte man zumindestens meinen. Heute im Programm: Drupal 4.5.2. Nettes Paket, gefällt mir vor allem weil es jetzt auch Kubrick als Theme für Drupal gibt und weil es recht mächtig ist und trotzdem noch einigermaßen überschaubar. Nur falle ich jedesmal wenn ich mich nach längerer Zeit wieder damit beschäftige auf die gleichen Sachen rein: zum Beispiel die Aktivierung von Übersetzungen. Ist ja toll das es Übersetzungen gibt. Aber wenn es nirgendwo auf der Website auch nur Andeutungen darauf gibt was man machen muss, dann sitzt man schon ziemlich doof da. Ok, ja, man muss nur das locale.module aktivieren. Und wo bitte steht das? In der x-ten Hierarchie im Administrationsmenü. Genauso toll: es wird eine Datenbankanbindung für PostgreSQL mitgeliefert. Dummerweise ist die aber erst ab PHP 4.3 brauchbar - ältere Versionen werden nicht unterstützt, obwohl Drupal ab 4.1 läuft. Nachdem ich alles umeditiert habe auf die alten Funktionsnamen liefs immer noch nicht: da fehlte scheinbar ein default für die Spalte uid in der Tabelle sessions. Nachdem ich das gesetzt hab, hängte sich das PHP auf beim Zugriff auf die Site. Ok, ja, ich weiss, MySQL nehmen (ich mag MySQL aber nicht ...). Fein, jetzt bin ich drin, ich hab auch Kubrick als Layout und deutsche Übersetzungen. Ok, einen Teil des Systems in Deutsch - da fehlen Berge von Strings. Also weiss ich was ich demnächst mal wieder machen werden. Toll. Genauso toll wie der Default-Wert für das Fileverzeichnis, der einfach nur "files" ist. Was nicht funktioniert wenn man Bilder upload für Benutzer erlauben will, weil dann "files" und "pictures" ohne / aneinandergehängt werden. Und nein, der / darf nicht vor "pictures" stehen, sondern muss hinter "files" stehen. Das bei Kubrick das Menü in der rechten Spalte bei der Aktivierung von Blöcken natürlich als "links" ausgewählt werden muss, brauche ich sicherlich nicht extra zu erwähnen. Und das das Handbuch alles andere als aktuell ist - sorry, aber das ist einfach lachhaft. Da wird noch von Verzeichnisstrukturen zum Teil gesprochen, die gibts garnicht mehr. Nein, die Einstellungen sind nicht in sites/default/settings.php - die sind in includes/conf.php.

Menno. Das ist so ein schönes Projekt. Und das ganze System ist wirklich leistungsfähig und stabil. Aber die Dokumentation ist wirklich ein Witz. Manchmal hab ich das Gefühl die Leute dokumentieren garnicht Drupal sondern irgendwas anderes

Schön ist es trotzdem, also will ich mal nicht zu laut meckern. Andere machens ja auch nicht wirklich besser. Trotzdem - könnte so schön sein, wenn der Hinweis auf das Online-Handbuch wirklich helfen statt verwirren würde ...

Rat der EU ignoriert Forderung des Parlaments - tja, war ja fast zu erwarten. Wozu mit Demokratie anfangen, hält doch nur auf ...

Spreeblick: Sweety Records

Spreeblick erklärt uns die Musikindustrie: Sweety Records

Teufelsgrinsen

In "Von der GPL" schreibt Isotopp über die GPL und was tatsächlich drin steht und wie man es verstehen kann. Eine recht gute Erläuterung, wie ich finde. Sollte jedem empfohlen werden zu lesen der den Unfug glaubt, den Microsoft, SCO und einige andere über die GPL verbreiten.

Hartz-IV-Urban-Legend

Urban Legends Reference Pages: Media Matters (Hot Jobs) beschreibt wie aus einer hypothetischen Überlegung der TAZ und einem Bericht über einen Bordellbetreiber der keine Prostituierten für sein Bordell findet (und sie nicht über das Arbeitsamt suchen darf, weil sich dieses weigert solche Jobs auszuschreiben) dann Tatsachenberichte in der englischsprachigen Presse wird, in denen dann behauptet wird das Frauen die sich weigern Jobs als Prostituierte anzunehmen ihr Arbeitslosengeld verlieren würden.

Soviel zum professionellen Journalismus

Teufelsgrinsen

Wobei ich allerdings hoffen möchte das nicht durch unsere ach so tollen Prolethiker irgendwann aus der Zeitungsente nachträglich die Wahrheit wird ...

Microsoft erhält Patent auf Koordinaten in URLs - was für ein hochgradiger Schwachsinn. Wieder mal ein Beweis dafür, das Patente auf Algorithmen einfach nur Moppelkotze sind und bestenfalls der Geldabzocke dienen können, aber sicherlich nicht der von den Verteidigern immer wieder gerne zitierten Innovationslust.

Neuer Phishing-Angriff in vielen Web-Browsern möglich

Bei golem gelesen: Neuer Phishing-Angriff in vielen Web-Browsern möglich. Klasse. Wieder mal schludrig implementierte Lösung und schludriger Standard. Das ganze Umlaut-Domain-Geraffel ist eh so ein Unfug das man sich fragt wieso das überhaupt umgesetzt wurde - allein schon die Tatsache das der Mist nur für Webseiten funktiniert und die IDNs nicht für irgendwas anderes sinnvoll nutzbar sind hätte jeden drauf stoßen müssen was für ein Quatsch das ist. Und jetzt ist es auch noch ein Phishing-Loch.

Smog könnte Allergien fördern. Na toll. In der Stadt wird meine Allergie gefördert und auf dem Land geh ich am Heuschnupfen ein.

The MBROLA PROJECT HOMEPAGE - das MBROLA Projekt liefert einen freien Phonemsynthesizer. Phoneme rein, Sprache raus. Als Basis dienen Diphone-Datenbanken, die für eine ganze Reihe von Sprachen verfügbar sind. Auf der Projektseite gibt es auch Links zu Text-to-Speech-Projekten die auf MBROLA aufbauen.

Clement für Anhebung des Rentenalters

Clement für Anhebung des Rentenalters - klasse Idee. Erstmal werden die Wochenarbeitszeiten hochgedreht. Dann die Lebensarbeitszeit. Und dann sind wir wieder da, wo wir mal waren: Arbeiter treten sozialverträglich vor Erreichen des Rentenalters den Weg in den Sarg an. Und schon gehts der Rentenversicherung wieder besser.

Doing the GNUstep two-step

Doing the GNUstep two-step ist ein schon älterer Bericht über die GNUStep Live CD. Ich verlink den nur, weil dort ein Problem drin beschrieben ist, das mich selber auch schon genervt hat: die CD bootet nicht. Was für eine Live-CD ziemlich dämlich ist. Und nein, die Argumentation das es auf einigen alten Rechnern nicht bootet zieht nicht - der Rechner der hier das Problem hat ist gerade mal ein Jahr alt.

Die GNUStep Live CD Entwickler sollten wirklich das Problem mal angehen und lösen - denn wenn auf einem Rechner alle möglichen Knoppix-Varianten booten, auch die Gnoppix-CD bootet - dann gibt es keinen Grund, das die GNUStep CD nicht booten sollte. Und nein, Disketten sind keine Alternative - der Rechner hat kein Diskettenlaufwerk. Dafür ist er einfach zu neu ...

Falls ich mal eine web-basierte Projektverwaltung angucken will, dotproject - Open Source Project and Task Management Software sieht ganz brauchbar aus.

GeoURL ist wieder da

GeoURL ist neu belebt worden - bzw. es ist ein neuer GeoURL Service aufgebaut worden. Einfach hingehen, die eigene Site anmelden und dann einen Link wie meinen in der Nähe Link einbauen. Und schon können wir wieder sehen wer in der Nähe sitzt. Das ganze ist noch etwas spartanisch, aber es reicht um Nachbarn zu finden (Grüsse rüber nach Paderborn en Groetjes naar Enschede!).

Um meinem eingerostetes Niederländisch (ich kanns zwar relativ fliessend lesen, aber nur extrem holperig schreiben) zu helfen hat mir übrigens das deutsch-niederländische Wörterbuch bei pauker.at geholfen.

Update: cool, kaum postet man darüber, schon kommen auch andere Nachbarn wieder zum Vorschein. Und was stelle ich fest: die Gedankenschnipsel sind jetzt auch mit WordPress unterwegs.