40 lines
2.1 KiB
Markdown
40 lines
2.1 KiB
Markdown
---
|
|
layout: post
|
|
lang: es
|
|
title: "Buscador mwmbl"
|
|
date: 2023-08-03 20:38:42 +0100
|
|
categories: recommendations
|
|
---
|
|
|
|
Esta es mi primera publicación desde hace algunos meses --aproximadamente 10-- debido a «cuestiones laborales».
|
|
|
|
Tengo algún tutorial por publicar pero es necesario que le realice alguna limpieza previa ya que está adaptado para un uso concreto y hay que redactarlo de forma genérica.
|
|
|
|
Entre esas «cuestiones laborales» he estado participando en un proyecto conocido como [mwmbl](https://mwmbl.org/).
|
|
|
|
## Mini introducción
|
|
|
|
De forma simple, se trata de un buscador sin ánimo de lucro creado por un equipo de 2 personas.
|
|
|
|
Está desarrollado en el lenguaje de programación Python y externaliza la parte de indexación de sitios web.
|
|
|
|
Básicamente, el servidor principal recoge listados de sitios web de una lista previamente analizada, y las herramientas de indexación se conectan al mismo, descargan un conjunto de webs a indexar, realizan la operación y devuelven el resultado al servidor.
|
|
|
|
El buscador es actualmente usable y es accesible desde su sitio web inicial con un índice ya considerablemente grande y rondando más de medio millón de sitios indexados al día.
|
|
|
|
Es mucho más modesto que los buscadores mayoritarios y carece de funciones avanzadas, pero sirve para búsquedas de texto completas.
|
|
|
|
## Participación
|
|
|
|
Existen varias formas de participar en el proyecto:
|
|
|
|
* Donando: yo recomiendo hacerlo a través de [su colectivo en OpenCollective](https://opencollective.com/mwmbl/) cuyos fondos van destinados a hacer crecer la infraestructura inicial.
|
|
* Indexando:
|
|
- Se puede ayudar usando la extensión para [Mozilla Firefox](https://addons.mozilla.org/en-GB/firefox/addon/mwmbl-web-crawler/).
|
|
- O ejecutando el [servicio de indexación](https://github.com/mwmbl/crawler-script/) (**aviso**: se hospeda en GitHub) en un servidor propio.
|
|
* Programando: si sabes algo de Python o incluso JavaScript para el frontal web o su extensión es posible que puedas participar en sus [repositorios](https://github.com/mwmbl/) (**aviso**: se hospeda en GitHub).
|
|
|
|
---
|
|
|
|
**Redacción:** [EchedeyLR](/redaction.html#EchedeyLR)
|