"Mapeando" sobre estructuras de datos

Hace unos días tuve una conversación con mi equipo sobre el uso de la función map en Rust. Como puede resultar didáctico para aquellos que quieran saber más sobre Programación Funcional he decidido reproducirlo por aquí.

¿Qué es `map`?

La concepción más popular de map (y también de las otras dos entidades que forman la conocida tríada de funciones de orden superior, filter y reduce o fold) viene de su uso en iteradores como listas, arrays, etc. Esto no solo ocurre en Rust sino también en otros lenguajes como JavaScript.

Sin embargo, en algunos casos puede ser útil generalizar nuestra concepción de map un poco más para razonar mejor cómo se comporta en otros contextos. Por ejemplo, ¿qué hay de los tipos Option y Result en Rust? ¿Por qué existe un método map para estos dos tipos? ¿Es casual que ambos métodos tengan el mismo nombre?

Otra perspectiva

Una manera alternativa de comprender la función map, que también abarca su disponibilidad como método en Option y Result, es considerarla una función implementable para estructuras equivalentes a contenedores de otros tipos. De esta forma, map opera aplicando la función pasada como parámetro al valor del tipo contenido, sustituyéndolo por el valor de salida de la aplicación, pero sin modificar el contenedor en sí.

Representación del uso de la función map usando contenedores como analogía Fuente: https://functionalprogrammingcsharp.com/functors-monads

`map`s en Rust con esta perspectiva

En tipos `Option`

Con el enfoque anterior, un valor de tipo Option<T> se transforma en un valor de tipo Option<U> si llamamos a la función map pasándole una función que implemente Fn(T) -> U ¹ que transformará T en U, dejando el contenedor Option<_> intacto.

En tipos `Result`

Result es un poco más interesante. Es un tipo de dato con dos variantes, igual que Option, pero a diferencia de este, Result incluye un tipo en cada variante. La implementación de map para Result solo actúa en una de sus posibles variantes (Ok(_)) ignorando la otra.

¿Por qué Ok y no Err?

Dado que Result se usa habitualmente en situaciones en las que propagamos los errores en la variante Err(_) usando ?, nos importa la primera ocurrencia de la variante Err(_).

La función map, pues, no actúa sobre la variante Err(_).

Entonces, partiendo de un Result<T, E> obtenemos un Result<U, E> pasando un Fn(T) -> U ¹ . De nuevo, el valor de tipo T se transforma en un valor de tipo U, mientras que el contenedor Result<_, E> queda inalterado ² .

¿Qué más?

¡Podríamos tener maps para muchos otros tipos! ¿Por qué no una tupla con dos (o más) elementos, como (T, U)? ¿Por qué no un struct arbitrario que hayamos definido? ¿Tiene sentido usar map en estos casos?

Ya que parecen existir múltiples estructuras que podrían admitir una definición de map, ¿Tendría sentido la existencia de un trait (o, si lo tuyo es la Orientación a Objetos, quizá una interfaz) llamado Mappable o algo parecido?

¡La respuesta es sí!

Generalizando `map`

En Haskell, y otros lenguajes de programación funcional, el comportamiento de map está definido en lo equivalente a un trait de Rust (en dicho lenguaje, los traits se llaman typeclasses). Este trait se llama Functor.

La documentación sobre Functor, aunque algo matemática, parece estar de acuerdo con nuestro razonamiento anterior:

Un tipo f es un Functor si proporciona una función fmap que, dados dos tipos arbitrarios a y b permite aplicar cualquier función (a -> b) transformando f a en un f b, preservando la estructura de f.

[…]

La función se llama fmap en lugar de map por razones históricas (map se definió inicialmente, cómo no, para usarse con listas, luego fue generalizada) y de facilidad de uso (los recién llegados a Haskell comienzan usando map solo en listas y más adelante aprenden la abstracción para usar fmap).

Esa “función (a -> b)” que se menciona en la documentación citada es el Fn(T) -> U en nuestros ejemplos de Rust.

Existen implementaciones de Functor para muchos tipos en el ecosistema de Haskell, como para:

Listas
Conjuntos
Mapas
Maybe (el Option de Haskell)
Either (el Result de Haskell)
Tuplas de varios elementos
La aplicación de funciones en sí misma (¿Cuál podría ser la implementación de esto? 😉)
… y muchos otros, en creciente nivel de abstracción, para las que nuestra analogía de tipos contenedores empieza a quedarse corta ³ .

¿Qué hay de `filter` y `fold`?

Las otras funciones típicas de la programación funcional que mencionamos al principio, filter y fold o reduce, tienen sus propios traits o typeclasses: Filterable y Foldable.

Volviendo a Rust

¿Por qué entonces este Functor (o Filterable o Foldable) no está disponible en Rust? Por la sencilla razón de que Rust por ahora no puede representar fácilmente traits de este tipo, destinados a definirse para el contenedor y no para, digamos, tipos completamente definidos. Un buen ejercicio podría ser intentarlo, partiendo de alguno sencillo como Option, definiendo Functor e implementándolo para todo T (¡y U!) de Option<T>, quizá usando tipos asociados genéricos.

Para poder expresar esto de forma ergonómica, Rust tendría que soportar algo conocido como higher-kinded types ⁴ . Sin ello, Rust no puede definir fácilmente un trait que sea solo aplicable para tipos que acepten parámetros genéricos. Como menciono en el párrafo anterior, pero con otras palabras, a la definición de Functor le interesa más el Option<_>, que el Option<T> para un T conocido.

Cerrando

Pensar en map y otras funciones de orden superior con un nivel de abstracción un poco más alto al habitual es una puerta de entrada para adentrarse en la Programación Funcional. Rust, con su influencia notable de Haskell, permite aplicar parte de este paradigma.

Incluso si la programación funcional no es de tu interés, y ciertamente no tiene por qué serlo para usar map, pensar en las herramientas que usas habitualmente de forma más abstracta es un buen ejercicio para mejorar y cambiar tu forma de ver la programación y la ingeniería de software.

No dejes que el no poder expresar totalmente estos conceptos en Rust u otros lenguajes te impida razonar sobre qué puede representar realmente la función map, qué aspectos identifican a un tipo de dato como mapeable, qué otras abstracciones existen y cómo estas podrían usarse en tu lenguaje habitual.

¡Hasta otra!

Footnotes

Realmente en Rust es FnOnce(T) -> U, pero esto es otra discusión.

Aunque también existe map_err para actuar sobre la variante Err(_) o map_or_else para actuar sobre las dos variantes, generando un único tipo de salida U.

Un functor no es una caja.

No sé cómo se traduciría esto al español, ¿Tipos de clasificación superior, tal vez?

"Mapeando" sobre estructuras de datos

¿Qué es map?

Otra perspectiva

maps en Rust con esta perspectiva

En tipos Option

En tipos Result