BibSonomy

Синяя социальная система управления закладками и публикациями.

( en | de | ru )

 

группа
  • тэг
  • пользователь
  • группа
  • автор
  • концепция
  • BibTeX-ключ
  • поиск
unknowndata
  • войти в систему
  • регистрация
  • группы
  • популярные 
    • записи
    • тэги
    • авторы
    • концепции
    • обсуждения
  • войти в систему
  • регистрация

Login

Log in with your username.

@

Я забыл свой пароль.


Log in with your OpenID-Provider.

  • Other OpenID-Provider
  1. группа
  2. unknowndata
  3. bigdata web

Publication title

закладки  (спрятать)2
  • показать
  • всё
  • только закладки
  • закладки на страницу
  • 5
  • 10
  • 20
  • 50
  • 100
  • RSS
  • BibTeX
  • XML

  •  

     
    1ia-web-commons/src/main/java/org/archive/hadoop/ResourceRecordReader.java at master · internetarchive/ia-web-commons
     

    https://github.com/internetarchive/ia-web-commons/blob/master/src/main/java/org/archive/hadoop/ResourceRecordReader.java
    12 лет назад , @jaeschke
    • bigdata
    • web
    • archive
    • crawling
    • hadoop
    • analysis
    • warc
    • programming
     
      bigdatawebarchivecrawlinghadoopanalysiswarcprogramming
      копироватьудалить
      • Запись сообщества
      • посмотреть историю записи
       
       
    •  

       
      2Web Archive Transformation (WAT) Specification, Utilities, and Usage Overview - Internet Research - IA Webteam Confluence
       

      https://webarchive.jira.com/wiki/display/Iresearch/Web+Archive+Transformation+(WAT)+Specification,+Utilities,+and+Usage+Overview
      12 лет назад , @jaeschke
      • bigdata
      • web
      • wat
      • archive
      • crawling
      • hadoop
      • analysis
      • warc
       
        bigdatawebwatarchivecrawlinghadoopanalysiswarc
        копироватьудалить
        • Запись сообщества
        • посмотреть историю записи
         
         
      • ⟨⟨
      • ⟨
      • 1
      • ⟩
      • ⟩⟩

      публикации  (спрятать)1  
      • показать
      • всё
      • только публикации
      • публикации на страницу
      • 5
      • 10
      • 20
      • 50
      • 100
      • расширенный...
      • RSS
      • BibTeX
      • RDF
      • дальше...

      •  

         
        1IRLbot: : Scaling to 6 billion pages and beyond
         

        H. Lee, D. Leonard, X. Wang, и D. Loguinov. Transactions on the Web, 3 (3): 1--34 (июня 2009)
        4 лет назад , @jaeschke
        • bigdata
        • web
        • crawer
        • irlbot
        • crawling
         
          bigdatawebcrawerirlbotcrawling
          копироватьудалитьдобавить публикацию в буфер
          • Запись сообщества
          • посмотреть историю данной записи
          • URL
          • DOI
          • BibTeX
          • EndNote
          • APA
          • Chicago
          • DIN 1505
          • Harvard
          • MSOffice XML
           
           
        • ⟨⟨
        • ⟨
        • 1
        • ⟩
        • ⟩⟩

        unknowndata

        @unknowndata

        Unknown Data

        CV
        присоединиться

        просмотр

        • bigdata web как тэг всех пользователей
        • web как концепция всех пользователей
        • bigdata web как концепция всех пользователей

        сходные по теме тэги

        • + | crawling
        • + | archive
        • + | hadoop
        • + | analysis
        • + | warc
        • + | crawer
        • + | irlbot
        • + | wat
        • + | programming

        тэги

        • social
        • analysis
        • network
        • recommender
        • citation
        • tagging
        • sna
        • graph
        • data
        • folksonomy
        • semigroup
        • web
        • diploma
        • programming
        • collaborative
        • structure
        • myown
        • twitter
        • toread
        • semantic
        • matrix
        • map
        • mining
        • boolean
        • latex
        • reference
        • java
        • howto
        • tutorial
        • cbr
        • binary
        • bookmarking
        • detection
        • scientometrics
        • style
        • bibtex
        • conference
        • model
        • research
        • community
        • classification
        • generator
        • relation
        • 2008
        • text
        • search
        • linux
        • researcher
        Что такое BibSonomy?
        С чего начать
        Кнопки для браузера
        Помощь
        Разработчикам
        Обзор
        API-документация
        Контакт и защита личных данных
        о нас
        Cookies
        Сообщить о проблеме
        BibSonomy Вики
        Интеграция
        PUMA
        Расширение для TYPO3
        Плагин для
        Клиент Java REST
        Поддерживаемые источники
        далее
        О BibSonomy
        Команда
        Блог
        Список рассылки
        Социальные сети
         Наш Twitter

        BibSonomy разработана командами Knowledge and Data Engineering Group университета Касселя, Data Mining and Information Retrieval group Вюрцбургского университета и исследовательским центром L3S, Ганновер, Германия.