Improove på Twitter: "improove: Improove | Lärdomar och trender från Nordic eCommerce Summit 2012: Jag fick chansen att gå på Nordic eCommerce S... http://t.co/g3R8SyQU"
Sedan några veckor har vi en praktikant här på Swedmedia som gör ett utvecklingsprojekt till Dagen.se. Ett verktyg för reportrarna att ämnestagga artiklar som vi lägger ut på nätet. Bakgrunden är en utbildningsdag vi hade med Nikke Lindqvist som mynnade ut i ett konstaterande att om vi bättre kan innehållsbeskriva våra texter med taggar desto bättre inlänkningar bör vi kunna få från Google. Såväl fler som bättre.
Kruxet med denna typ av taggning är att det är en lite för tidsödande process för att reportrarna skall orka arbeta med det. Samtidigt som det har ett stort värde för slutprodukten. Dilemma. Därför initierade vi ett projekt där Annika tagit fram ett system som automatiskt identifierar nyckelord i en färdig text och föreslår nyckelord som reportrarna istället för kryssa bort om de inte stämmer. Detta förenklar helt klart processen och vi får bättre möjligheter att innehållstagga våra texter.
Däremot kan reportrarna föreslå nya nyckelord genom att markera det i texten och sedan lägga till det. Detta flöder blir helt klart mycket smidigare. Några problem som vi stött på är förstås böjningar av ord och olika ändelser som gör att flera fraser kan motsvara ett och samma nyckelord. Ett bra exempel är att verktyget skall identifiera såväl ”Göran Person” som ”Göran Persons” som samma nyckelord.
Än mer komplicerat blir det ju när man vill identifera ämnen som inte har en direkt fras kopplat till sig utan kanske ett 100-tal olika andra ämnen. Det kallar vi abstrakta nyckelord och skulle kunna exemplifieras genom t.ex. Mellanösternkonflikten. Hur identifierar man ett sådant? Vi tror att det går om man först hämtar alla exakta nyckelord med textmatchtningar och sedan grupperar dessa i abstrakta paraplyord. Så om vi hittar 40-tal nyckelord till Mellanösterkonflikten som t.ex.: Bosättningar, Gazaremsan, Palestina, Mahmoud Abbas, etc. Om vi sedan kanske får träff på 7-8 av dessa nyckelord rekommenderar vi detta men flaggar för osäkerhet.
Det hela är faktiskt ganska kul och nu har vi tagit fram en protoyp som matchar på de exakta fraserna. Just nu håller vi på att utveckla webservice’s så att vårt publiceringssystem klarar av att integrera detta i sitt gränssnitt.
Testa själv:
http://utveckling.swedmedia.se/extra/textanalys
I exemplet ovan länkar nyckelorden till Wikipediaartiklarna men på sikt skall de förstås länkas till ämnessidor på Dagen.se.
Efter att ha läst om att Fokus.se bygger på wordpress och efter några samtal med Emanuel om var vi bör ta Dagen.se rent tekniskt i framtiden har jag grävt lite på nätet för att se vilka möjligheter som finns att bygga webbpublicering av nyheter i Open Source. Det enkla svaret är att det inte finns någon tillräckligt bra färdigpaketerad lösning. Bland komersiella systemen har vi ju såväl Polopoly som Escenic. Det tidigare branschstandard i Sverige och det senare branschstandard i Norge. Båda kompetenta plattformar och om pengar inte är en avgörande faktor är de helt klart intressanta att titta på.
Men Open Source har ju fortfarande fördelar framför stängad system. Som t.ex.
Leverantörsoberoende – Att kunna anlita vem man vill att jobba med våra egna plattformar är en inte helt oviktig faktor.
En dela-med-sig-kultur -Open Source-världen har många fördelar och när man väl konnektar med nyckelpersoner som jobbar på samma plattformar är det inte mycket man håller för sig själv längre. Ur det uppstår mycket kreativt.
Friare att laborera fritt och testa det man vill. Stängda system är ju trots allt stängda. När vi vet väldigt lite om var mediabranschen befinner sig om 5 år är frihet att bygga det vi vill till rimliga kostnader mycket viktigt.
Val av programmeringsspråk
En annan faktor som jag normalt inte brukar ägna så stor uppmärksamhet åt är valet av programmeringsspråk. Även om jag brukar hävda att allt går att göra i alla system så är det faktiskt så att OpenSource-kulturen de senaste åren flyttat från Java till PHP och att det faktiskt börjar vara så att det finns ett egenvärde i att arbeta i PHP. Det finns förstås javamiljöer där man kan exekvera både PHP och Java bredvid varandra men jag vet inte. Det är nog bäst att välja antingen eller. Sen är det ju så att Java och .NET-konsulter kostar mer än PHP-konsulter av någon anledning.
Vi har idag inga direkta behov av att förändra Dagen.se men att röra sig från .NET mot PHP blir nog förr eller senare ett naturligt steg. Och då kan man ju fundera över vilken plattform man i så fall skulle välja.
Val av plattform
Problemet är ju som sagt att det inte finns något riktigt självklart val. Men efter att ha undersökt saken vidare måste jag nog komma fram till att Drupal sannolikt är det bästa alternativet för den som vill bygga seriösa öppna system för nyhetspublicering. Jag har ibland klagat på att Drupal är lite för geekigt men eftersom en nyhetswebb inte handlar om att bara slänga upp en sajt på en eftermiddag utan mer handlar om en långsiktig plattform som man skall bygga vidare på år efter år så är smidigheten faktiskt underordnad flexibiliteten i detta fall. Och på området teknisk flexibilitet är det få som slår Drupal på fingrarna.
Det verkar faktiskt redan finnas en utvecklarkultur som arbetar på Drupal för nyetspublicering. Videon nedan listar några case-studies. Det verkar också som att det finns en grupp på Drupal.org som handlar om just detta. Hur man gör integreringar mot Quark och Indesign m.m.
Drupal har själva också skriv en artikel i ämnet så det verkar som att det finns en liten utvecklarcommunity för detta. Och kan man bygga Fokus.se på WordPress kan man göra mycket mer med Drupal. Ett alternativ vore förstås att bygga hela webbplatsen själv från scratch baserat på Zend Framework med risk för att man måste uppfinna många hjul på egen hand.
Någon som har erfarenheter av att bygga något liknanden en nyhetswebb på Drupal eller direkt på Zend Framework för den delen?
Jag är ett fan av WordPress och älskar framför allt enkelheten i plattformen. Det gör att man med noga utvalda plugins och lite finurliga hack kan göra förvånansvärt mycket utan att för den sakens skulle trassla in sig allt för mycket i tekniken. Det är framför allt den här tekniska enkelheten som jag saknar i Joomla, en plattform som mer än något annat erbjuder ett tekniskt virrvarr.
Men även om man kan göra mycket har WordPress helt klart sina gränser men jag måste säga att jag blev imponerad när jag läste att Fokus.se är byggt på wordpress. Visst, Fokus har kanske inte den mest komplexa sajten men det är just det jag gillar. Att man istället för att bygga sin sajt onödigt komplex även låter den följa den tekniska enkelhetens filosofi. För att testa om det verkligen var WordPress testade jag att komma åt adminsidorna. Och mycket riktigt: www.fokus.se/wp-admin.
Jag kollade runt lite för att förstå hur man byggt och ser att varje vinjett är en kategori, användarkonto-sidorna är spetsade något och sedan har man tagit fram en egen version på kalendern och tänkt igenom valet av sidokolumnerna. Snyggast tycker jag nog ändå att Magazin-sidorna är där man presenterar alla artiklar från ett specifikt nummer. http://www.fokus.se/issues/2009/5/