Бесплатный курс по ruby. Зарегистрируйтесь для отслеживания прогресса →

Ruby: Массивы как множества

В работе над массивами есть особый набор операций, который пришёл к нам из математики – это операции над множествами. В Ruby для такого случая есть специальные операторы, близкие к их математическим эквивалентам.

Представьте себе задачу поиска взаимных друзей пользователей. Для формирования такого списка на уровне кода, нужно сравнить два массива (мои друзья и друзья друга) и найти пересечение, то есть общих друзей. В данном случае массивы с друзьями — это множества, а операция поиска общих элементов – пересечение (intersection).

Пересечение на Ruby выглядит так:

friends1 = ['igor', 'anna', 'nina', 'sergey']
friends2 = ['igor', 'petya', 'inna', 'anna']

# Выглядит как побитовое И, но это пересечение
friends1 & friends2 # ["igor", "anna"]
# или
# friends1.intersection(friends2)

Такой оператор очень удобен своей естественностью. Сразу понятно, о чём идёт речь. Как и в большинстве других операторов в Ruby, мы имеем дело с вызовами методов:

friends.&(friends2)

Подобная схема позволяет не только переопределять их поведение, но и комбинировать операторы между собой:

friends = ['anna', 'ivan']
friends1 & friends2 & friends # ["anna"]

У множеств и массивов с точки зрения математики есть одно принципиальное отличие, о котором нужно помнить. Во множествах каждый элемент представлен ровно один раз (то есть всё элементы — уникальны), в то время как в массивах такого ограничения не существует. Операции над множествами рассматривают массивы не как массивы, а именно как множества. Они удаляют дубли в результирующем массиве:

[1, 3, 4] & [1, 3, 3, 8] # [1, 3]

Объединение

Множество, объединяющее в себе элементы исходных множеств.

 [1, 3, 4] | [1, 3, 3, 8]
 # [1, 3, 4, 8]

Дополнение

Множество, состоящее из элементов первого множества, за минусом элементов, совпадающих со вторым множеством. Или по простому — это разница между двумя множествами.

# 4 – единственный элемент из первого множества, которого нет во втором
[1, 3, 4] - [1, 3, 3, 8] # [4]

Задание

Иногда в программировании возникает задача поиска разницы между двумя наборами данных, такими как объекты. Например, при поиске различий в json-файлах. Для этого даже существуют специальные сервисы, например, http://www.jsondiff.com/ (попробуйте нажать на ссылку sample data и кнопку Compare).

Реализуйте функцию gen_diff(), которая сравнивает два объекта и возвращает результат сравнения в виде объекта. Ключами результирующего объекта будут все ключи из двух входящих объектов, а значением — строка с описанием отличий: added, deleted, changed или unchanged.

Возможные значения:

  • added — ключ отсутствовал в первом объекте, но был добавлен во второй
  • deleted — ключ был в первом объекте, но отсутствует во втором
  • changed — ключ присутствовал и в первом, и во втором объектах, но значения отличаются
  • unchanged — ключ присутствовал с одинаковыми значениями и в первом, и во втором объектах
gen_diff(
  { one: 'eon', two: 'two', four: true },
  { two: 'own', zero: 4, four: true }
);
# {
#   one: 'deleted',
#   two: 'changed',
#   four: 'unchanged',
#   zero: 'added'
# }

Нашли ошибку? Есть что добавить? Пулреквесты приветствуются https://github.com/hexlet-basics
Если вы столкнулись с трудностями и не знаете, что делать, задайте вопрос в нашем большом и дружном сообществе