sign in · help · news · about · deen

BibSonomy ::  user :: jaeschke ::

The blue social bookmark and publication sharing system.
 

bookmarks

 (56)
<< < 1 | 2 | 3 > >> 
  • Short introduction to Vector Space Model (VSM) In information retrieval or text mining, the term frequency - inverse document frequency also called tf-idf,...
    Short introduction to Vector Space Model (VSM) In information retrieval or text mining, the term frequency - inverse document frequency also called tf-idf, is
    to document frequency information ir learning machine model retrieval search space term tfidf vector vsm web by jaeschke on Feb 8, 2012, 1:03 PM
    (0)
  • to closures html javascript programming web by jaeschke on Jan 31, 2012, 6:29 PM
    (0)
  • Brad Fitzpatrick recently wrote an elegant and important post about the Social Graph, a term used by Facebook to describe their social network. In his post...
    Brad Fitzpatrick recently wrote an elegant and important post about the Social Graph, a term used by Facebook to describe their social network. In his post, Fitzpatrick defines &quot;social graph&quot; as &quot;the global mapping of everybody and how they're related&quot;. He went on to outline the problems with it, as well as a broad set of goals going forward. One problem is that currently you need to have different logins for different social networks. Another issue is portability and ownership of an individual's information, explicitly and implicitly revealed while using social networks. As was recently asserted in the Social...
    to graph web sna analysis network social by jaeschke and 3 other users on Dec 6, 2011, 7:08 PM
    (0)
  • As a Google user, you're familiar with the speed and accuracy of a Google search. How exactly does Google manage to find the right results for every query ...
    As a Google user, you're familiar with the speed and accuracy of a Google search. How exactly does Google manage to find the right results for every query as quickly as it does? The heart of Google's search technology is PigeonRank™, a system for ranking web pages developed by Google founders Larry Page and Sergey Brin at Stanford University.
    to fun pigeonrank ranking search web by jaeschke and 2 other users on Dec 6, 2011, 12:06 PM
    (0)
  • Its so fun to write oversimplified posts about such-and-such is dead. Not because its true. At best you can point out something is broken and alternatives ...
    Its so fun to write oversimplified posts about such-and-such is dead. Not because its true. At best you can point out something is broken and alternatives are rising fast. But I wonder how the people behind the aging technology and...
    to search social web pagerank ranking by jaeschke and 1 other user on Nov 14, 2011, 10:47 AM
    (0)
  • to html javascript library openid programming web by jaeschke and 1 other user on Jul 15, 2011, 4:29 PM
    (1)
  • site for experimenting with the features of html5
    to html html5 web by jaeschke and 1 other user on Jul 14, 2011, 11:26 AM
    (2)
  • 13 design guidelines for tab controls are all followed by Yahoo Finance, but usability suffers from AJAX overkill and difficult customization.
    to ajax css design guide howto javascript tab web by jaeschke and 4 other users on Jul 7, 2011, 10:23 AM
    (0)
  • to bibsonomy bibsonomynews blog content data fotw linked negotiation semantic web by jaeschke on May 20, 2011, 3:15 PM
    (0)
  • to content data howto linked lod negotiation semantic tutorial uri web by jaeschke and 18 other users on Apr 21, 2011, 10:48 AM
    (0)
  • to pingback semantic todo web by jaeschke and 2 other users on Mar 30, 2011, 4:23 PM
    (0)
  • to pingback programming refback trackback web by jaeschke on Nov 20, 2010, 7:11 PM
    (0)
  • to 2010 bibsonomy bibsonomynews blog data ekaw feature linked pingback semantic web by jaeschke on Oct 14, 2010, 12:02 PM
    (0)
  • A Revised Taxonomy of Social Networking Data Lately I've been reading about user security and privacy -- control, really -- on social networking sites. ...
    A Revised Taxonomy of Social Networking Data Lately I've been reading about user security and privacy -- control, really -- on social networking sites. The issues are hard and the solutions harder, but I'm seeing a lot of confusion in even forming the questions. Social networking sites deal with several different types of user data, and it's essential to separate them. Below is my taxonomy of social networking data, which I first presented at the Internet Governance Forum meeting last November, and again -- revised -- at an OECD workshop on the role of Internet intermediaries in June. * Service data is the data you give to a social networking site in order to use it. Such data might include your legal name, your age, and your credit-card number. * Disclosed data is what you post on your own pages: blog entries, photographs, messages, comments, and so on. * Entrusted data is what you post on other people's pages. It's basically the same stuff as disclosed data, but the difference is that you don't have control over the data once you post it -- another user does. * Incidental data is what other people post about you: a paragraph about you that someone else writes, a picture of you that someone else takes and posts. Again, it's basically the same stuff as disclosed data, but the difference is that you don't have control over it, and you didn't create it in the first place. * Behavioral data is data the site collects about your habits by recording what you do and who you do it with. It might include games you play, topics you write about, news articles you access (and what that says about your political leanings), and so on. * Derived data is data about you that is derived from all the other data. For example, if 80 percent of your friends self-identify as gay, you're likely gay yourself. There are other ways to look at user data. Some of it you give to the social networking site in confidence, expecting the site to safeguard the data. Some of it you publish openly and others use it to find you. And some of it you share only within an enumerated circle of other users. At the receiving end, social networking sites can monetize all of it: generally by selling targeted advertising. Different social networking sites give users different rights for each data type. Some are always private, some can be made private, and some are always public. Some can be edited or deleted -- I know one site that allows entrusted data to be edited or deleted within a 24-hour period -- and some cannot. Some can be viewed and some cannot. It's also clear that users should have different rights with respect to each data type. We should be allowed to export, change, and delete disclosed data, even if the social networking sites don't want us to. It's less clear what rights we have for entrusted data -- and far less clear for incidental data. If you post pictures from a party with me in them, can I demand you remove those pictures -- or at least blur out my face? (Go look up the conviction of three Google executives in Italian court over a YouTube video.) And what about behavioral data? It's frequently a critical part of a social networking site's business model. We often don't mind if a site uses it to target advertisements, but are less sanguine when it sells data to third parties. As we continue our conversations about what sorts of fundamental rights people have with respect to their data, and more countries contemplate regulation on social networking sites and user data, it will be important to keep this taxonomy in mind. The sorts of things that would be suitable for one type of data might be completely unworkable and inappropriate for another.
    to folksonomy network privacy security social tagging taxonomy web by jaeschke and 3 other users on Oct 11, 2010, 3:27 PM
    (0)
  • Gave invited talk "Making Sense of Users' Web Activity" at PSD2010@EKAW workshop
    to 2010 activity ekaw invited person psd sense talk web by jaeschke on Oct 11, 2010, 2:39 PM
    (0)
  • Ovid LinkSolver is a comprehensive, OpenURL resource linking solution that expands the power of linking to a wide variety of internet resources through the...
    Ovid LinkSolver is a comprehensive, OpenURL resource linking solution that expands the power of linking to a wide variety of internet resources through the LinkSolver Administrative Tool.
    to library linking openurl ovid publication web by jaeschke and 1 other user on Jul 21, 2010, 1:47 PM
    (0)
  • Forderungen für ein lebenswertes Netz 2010-07-19 14:35:00, erdgeist Der Chaos Computer Club (CCC) hat seit Beginn seines Bestehens die Chancen und Mögl...
    Forderungen für ein lebenswertes Netz 2010-07-19 14:35:00, erdgeist Der Chaos Computer Club (CCC) hat seit Beginn seines Bestehens die Chancen und Möglichkeiten, die das vernetzte Leben mit sich bringt, erkannt und propagiert. Viele der ursprünglichen – damals noch futuristisch anmutenden – Visionen sind inzwischen nicht nur Realität, sondern Selbstverständlichkeiten in der Mitte der Gesellschaft geworden. Der Einzug des Internets in den Alltag fast der gesamten Bevölkerung hat uns Datenschutzsorgen gebracht, aber auch zu einer Demokratisierung, einer Bereicherung aus wissenschaftlicher, sozialer und künstlerischer Sicht geführt. Die Selbstheilungskräfte des Internets haben dabei viele befürchtete dystopische Auswüchse ohne staatliches Eingreifen verhindern können. Aus unserer Sicht liegt der aktuellen Diskussion eine Fehleinschätzung zugrunde, an welchen Stellen Regulierungsbedarf notwendig ist und an welchen nicht. Wir haben daher in klare Worte gefaßt, welche Errungenschaften erhalten und welche aktuellen Mißstände unserer Meinung nach angepackt werden müssen, welche Risiken für die Zukunft einer wettbewerbs- und lebensfähigen Gesellschaft im Netz wir sehen und wohin die Reise gehen soll. Diese Reise kann natürlich nur unter Mitnahme aller Bürger, die ausreichend schnell, unzensiert und unbevormundet an ein interaktives Netz angeschlossen sind, Fahrt aufnehmen. Wir sehen es als Problem, wenn das Netz nur als Quell ewigen Übels wahrgenommen wird, welches streng reguliert und möglichst mehrwert-gerecht präsentiert werden muß. Als Abbild des Lebens hat der Markt im Netz seinen Platz – genau wie die Politik, aber keiner der Spieler darf zum übermächtigen Kontrolleur werden. Dazu muß der Staat mit gutem Beispiel vorangehen, darf sich nicht weiter in IT-Großprojekten über den Tisch ziehen lassen, muß die digitale Intimsphäre seine Bürger achten und selbst mit angemessener Transparenz für alle nachvollziehbar, am besten gar maschinenlesbar werden. Und wer Mißstände, Korruption und Datenskandale aufdeckt, muß belohnt, nicht geächtet und bestraft werden. Dabei sollen die Netzbürger nicht bloß als statistische (Stör-)Größe in ausufernd wachsenden Datenbanken verbucht und verarbeitet werden. Im Gegenteil: Sie sind der Souverän und müssen im selbstbestimmten Umgang mit ihrem Netz ausgebildet werden. Dazu gehört, den Wert von Privatsphäre zu erkennen und mit den intimsten Geheimnissen achtsam umzugehen. Das Netz ist unsere gemeinsame Infrastruktur; unser Staat sollte sie aufbauen, hegen und pflegen, anstatt sich auf das Kleinhalten und Reglementieren zu konzentrieren. Wir müssen Sorge tragen, daß Bedarfsträger und Verwertungsindustrie nicht mehr Provider und Webseitenbetreiber als Hilfssheriffs und Sündenböcke vor den Karren spannen können. Gleichzeitig müssen die seit langem konkret bekannten Fehlentwicklungen bei Fragen der Softwarepatente und des Urheberrechts korrigiert werden. Ohne neue Grundregeln für das Immaterialgüterrecht und eine Orientierung am Gemeinwohl statt an den wirtschaftlichen Interessen einiger weniger wird sich die Kluft zwischen Politikern und Internetgemeinde nur noch vertiefen. Wir haben unseren Standpunkt in die folgenden elf Thesen zusammengefaßt, die wir hiermit zur Diskussion stellen. Thesen zur Netzpolitik 1. Netzzugang ist ein Grundrecht und Bedingung für die Teilnahme am kulturellen und politischen Leben Es ist Aufgabe des Staates, dafür Sorge zu tragen, daß alle Bürger Zugang zu breitbandigem Internet haben. Als Medium der Informationsbeschaffung löst das Internet den Fernseher ab, daher muß auch die Grundversorgung großzügig dimensioniert sein, damit sich jeder Bürger breitbandigen Netzzugang leisten kann. Auch darf der Entzug des Netzzugangs nicht als Strafe in Erwägung gezogen werden, weil das verhindern würde, daß Bürger am kulturellen und politischen Leben teilnehmen können. 2. Nutzen des Netzes kann sich nur entfalten, wenn die Netzneutralität garantiert ist Kein Zugangsanbieter darf nach inhaltlichen Kriterien Einfluß auf die Verfügbarkeit, Priorisierung oder Bandbreite der weitergeleiteten Daten nehmen. Einflußnahme ist generell nur akzeptabel, wenn das dem Kunden gegenüber transparent und Teil der Vertragsbedingungen ist und tatsächlich ein Kapazitätsengpaß besteht, also der Einfluß dazu dient, allen Kunden einen fairen Teil der bestehenden Kapazität zuteil werden zu lassen. Ein Zugangsanbieter dürfte etwa – wenn das im Vertrag steht – allen Kunden die Bandbreite beschränken, um eine Mindestbandbreite für Telefonie zu reservieren, weil Telefonate sonst gar nicht gingen. Beim Beschränken der Bandbreite dürfte er aber nicht die weiterzuleitenden Daten durchleuchten und etwa nur manche Dienste beschränken. 3. IT-Großprojekte der öffentlichen Hand nach sinnvollen Kriterien vergeben Es sollen in Zukunft die sachpolitischen Fragen im Vordergrund stehen. Das Konzept und die Vergabe von staatlichen IT-Projekten sollen nicht weiterhin als bloße Förderprojekte für die IT-Industrie betrachtet werden. Es ist stets auch eine vorsichtige Abwägung zwischen Bürokratieabbau und zentralisierter Datenerfassung zu bedenken. In Deutschland werden nicht selten IT-Projekte vergeben, denen es an sinnvoller Begründung und sachkundiger Konzeption mangelt. Regelmäßig scheitern sie auf ganzer Linie. Vom digitalen Behördenfunk über die Finanzamts-Software, über den "Exportschlager" Mautinfrastruktur bis hin zum "Exportschlager" Gesundheitskarte bietet das staatlich geförderte Portfolio reihenweise Rohrkrepierer. 4. Öffentliche Daten transparent handhaben Mit Steuermitteln finanzierte Ergebnisse und Inhalte müssen allgemeinfrei werden. Der Staat hat dafür zu sorgen, daß sie im Internet für jeden verfügbar sind. Patente auf Ergebnisse, die aus Steuermitteln finanziert wurden, sind unzulässig. Die Allgemeinheit betreffende Daten wie statistische Erhebungen, Wetterdaten, geographische Daten und Karten, Satellitenaufnahmen etc. fallen auch unter diese Regelung, selbst wenn sie nicht mit Steuermitteln finanziert wurden. 5. Klare Absage an Softwarepatente Softwarepatente bedrohen nicht nur die europäische Softwareindustrie, sondern auch das Internet selbst. Obwohl es laut Gesetz keine Softwarepatente gibt, hat das Europäische Patentamt hunderte von ihnen erteilt. Diese Patente sollen allesamt gestrichen werden. Es muß gesetzlich sichergestellt werden, daß es auch in Zukunft keine Softwarepatente gibt. 6. Urheberrechtgesetzgebung modernisieren Der Urheberrechtsschutz darf nicht weiter ausufern. Die Durchsetzung der Rechte der Verwertungsindustrie hat zu einem massenhaften betriebenen Abmahn-Geschäftsmodell und damit zu einem Rechtsmißbrauch geführt. Wir fordern daher eine Bagatellgrenze für die Verfolgung von Verletzungen von Immaterialgüterrechten und die Einschränkung der Kosten bei der Durchsetzung gegen Privatleute ohne kommerzielle Vorteile aus der Verletzung. Die Schutzfristen für urheberrechtlich geschützte Werke sollen verkürzt werden, um die Allmende zu stärken. Der Chaos Computer Club setzt sich für eine Neuregelung des Kompensationsmodells für Urheber ein. Ihre Rechte und ihre Unabhängigkeit von der Verwertungsindustrie sollen gestärkt werden. Der CCC wird hierzu eine eigene Idee für die Bezahlung vorstellen, welche die Idee der Kulturflatrate abwandelt. 7. Zugangsprovider haften nicht für die Daten ihrer Kunden Neben den Zugangsprovidern soll auch die Haftung der Webseitenbetreiber für Daten ihrer Benutzer ausgeschlossen werden. Zugangsprovider und Betreiber von Webseiten sollen zudem nur in schwerwiegenden Kriminalfällen die persönlichen Daten ihrer Kunden und Benutzer offenbaren dürfen. Diensteanbietern sollen ermuntert werden, keine Logdaten über ihre Benutzer zu erheben und nicht nach persönlichen Daten zu fragen. 8. Private Daten besser schützen Für den Staat muß eine rigide Datensparsamkeitsregelung gelten. Daten, die nicht objektiv gebraucht werden, dürfen nicht erhoben werden. Anfallende Daten sind unverzüglich zu löschen, wenn kein Speicherzweck belegt werden kann. Hier sind keine könnte-würde-hätte-Argumentationen der Polizeilobby gültig, sondern ein konkreter und die Nachteile aufwiegender Nutzen muß nachgewiesen sein. Das Weitergeben von zu Unrecht erhobenen Daten sowie Datenmißbrauch sollen endlich mit empfindlichen Strafen bewährt werden. Auch bestehende Regelungen müssen geprüft werden. Andere Länder kommen ganz ohne Personalausweis aus, etwa die USA und Großbritannien. Wieso brauchen wir einen Personalausweis, zumal einen mit biometrischen Daten und Online-Zugriff der Behörden auf die Ausweisdaten? Wieso darf unser Paß biometrische Daten enthalten? Biometrische Ausweisdokumente mit funkendem Mikrochip sind nicht sinnvoll begründet, daher soll ihre Verbreitung nicht fortgeführt werden. 9. Recht auf Anonymität etablieren Anonymität ist ein wichtiges Gut, sowohl in der realen Welt als auch im Internet. Für die politische Willensbildung ist es wichtig, daß Bürger sich informieren und diskutieren können, ohne sich beobachtet oder verfolgt zu fühlen. Authentizität im Internet darf nicht zu Lasten der Anonymität gehen und nicht durch erkennungsdienstliche Behandlung erkauft werden. Wir fordern daher, daß Betreiber bestehender anonymer Kommunikationsmöglichkeiten wie etwa Tor nicht weiter Verfolgung und Repressalien ausgesetzt werden, sondern eindeutig gesetzlich geklärt wird, daß sie nicht für über ihre Dienste getätigte Äußerungen belangt werden dürfen. Die vermehrten Beschlagnahmen von Computern, die Anonymisierungsdienste betreiben, sind zu beenden. Dies gilt umso mehr, da Menschen aus nicht-demokratischen Staaten auf die Bereitstellung solcher Dienste angewiesen sind. 10. Profilbildung über Menschen verhindern Im Internet verbreitete Daten betreffen die Privatsphäre der Bürger und lassen das Erstellen umfangreicher Persönlichkeitsprofile zu. Sie müssen daher stark geschützt werden. Dies betrifft sowohl die Nutz- als auch die Bewegungsdaten. Die Zusammenführung von Daten ermöglicht zusätzliche Einblicke in die Privatsphäre der Bürger. Daher soll datenschutzrechtlich dafür gesorgt werden, daß auch jemand, der legal Zugriff auf mehrere Datenbanken hat, daraus für ihn nicht das Recht auf Zusammenführung der Daten folgt. Datenverschlüsselung als Mittel zum informationellen Selbstschutz ist ein Grundrecht und darf nicht beschnitten werden. Dazu gehört auch, daß niemand gezwungen werden kann, seine Paßwörter oder Schlüssel offenzulegen. 11. Whistleblower-Schutz verbessern Whistleblower müssen geschützt und dürfen nicht verfolgt werden. Keiner, der den Mut zeigt, verborgene Mißstände öffentlich zu machen, darf benachteiligt werden. Wer unbequeme Wahrheiten auch unter persönlicher Gefahr ausspricht und weitergibt, soll daher gesetzlich geschützt werden. Links: [1] Chaosradio-Sendung "Hier stehen wir und können nicht anders: CCC-Thesen zur Netzpolitik": http://chaosradio.ccc.de/cr158.html [2] Thomas de Maizière: "14 Thesen zu den Grundlagen einer gemeinsamen Netzpolitik der Zukunft" http://www.bmi.bund.de/cae/servlet/contentblob/1099988/publicationFile/88667/thesen_netzpolitik.pdf [3] Spickzettel des CCC für digitale Bürgerrechte http://ccc.de/de/updates/2009/pm-spickzettel
    to ccc gesellschaft internet leben net netz privacy recht society web by jaeschke on Jul 20, 2010, 2:16 PM
    (0)
  • JSON.simple is a simple Java toolkit for JSON. You can use JSON.simple to encode or decode JSON text.
    to java javascript json programming simple web by jaeschke and 1 other user on Jul 20, 2010, 11:28 AM
    (0)
  • How does the web search behavior of ``rich'' and ``poor'' people differ? Do men and women tend to click on different results for the same query? What are s...
    How does the web search behavior of ``rich'' and ``poor'' people differ? Do men and women tend to click on different results for the same query? What are some queries almost exclusively issued by African Americans? These are some of the questions we address in this study. Our research combines three data sources: the query log of a major US-based web search engine, profile information provided by 28 million of its users (birth year, gender and zip code), and US-census information including detailed demographic information aggregated at the level of ZIP code. Through this combination we can annotate each query with, e.g., the average per-capita income in the ZIP code it originated from. Though conceptually simple, this combination immediately creates a powerful demographic profiling tool. The main contributions of this work are the following. First, we provide a demographic description of a large sample of search engine users in the US and show that it agrees well with the distribution of the US population. Second, we describe how different segments of the population differ in their search behavior, e.g. with respect to the diversity of formulated queries or with respect to the clicked URLs. Third, we explore applications of our methodology to improve web search and, in particular, to help issuing query reformulations. These results enable the creation of a powerful tool for improved user modeling in practice, with many applications including improving web search and advertising. For instance, advertisements for ``family vacations'' could be adapted to the (expected) income of the person issuing the query, or search suggestions shown to users could be adapted to items that are more interesting given their particular characteristics.
    to demographics search sigir toread web by jaeschke on Jul 12, 2010, 6:24 PM
    (0)
  • to design font web by jaeschke and 2 other users on Jun 18, 2010, 8:56 AM
    (0)
<< < 1 | 2 | 3 > >>bookmarks per page: 5 10 20 50 100  

publications

 (62)
<< < 1 | 2 | 3 > >> 
<< < 1 | 2 | 3 > >>publications per page: 5 10 20 50 100  
a gripper