Как подсчитать уникальные значения на основе другого столбца в Excel?
Поиск уникальных элементов в одном столбце excel
У меня есть два столбца в Excel, которые содержат некоторые общие данные и некоторые уникальные данные для каждого столбца. Я хочу создать два дополнительных столбца, содержащих данные, которые находятся в столбце A, но не в столбце A, и данные, которые находятся в столбце B, но не в столбце A. Я пытался использовать функцию Vlookups, но не думаю, что смогу получить искомое таким образом.
2 ответа
- Формула Excel: количество уникальных ячеек в столбце, ЕСЛИ соответствующее значение определено строкой.
В настоящее время у меня есть формула, которая просто подсчитывает уникальные значения в столбце: =SUM(IF(FREQUENCY(A2:A10,A2:A10)>0,1)) Однако я хочу подсчитывать их только в том случае, если соответствующая ячейка в той же строке имеет указанное значение. Возможно ли это без.
На форуме нет хорошего решения этой проблемы. Если я его упустил, подскажите, пожалуйста. В EXCEL 2010 нужно подсчитать уникальные значения в столбце. В рабочем листе 1 миллион строк и 10 столбцов. Значения ячеек — все строки или числа. Я.
Для этих элементов Col. A, которых нет в Col. B, попробуйте ввести эту формулу в таблицу (вводится в ячейку, затем заполняется, пока не вернутся пробелы)
И для позиций в колонке B, не включенных в колонку A :
Формулы предполагают, что ваши данные начинаются со строки 2 (строка 1 будет меткой), и что диапазоны для ColA и ColB начинаются со строки 2.
Кроме того, формулы предполагают отсутствие пробелов в данных. Для пустых ячеек используйте следующие формулы:
Это легко сделать с помощью PivotTable, если вы готовы слегка изменить свои данные:
Похожие вопросы:
У меня вопрос к Excel — есть ли способ использовать функцию для подсчета всех уникальных значений в столбце на основе сопоставления содержимого другого столбца с определенным процентом.
Дублирование данных: Подсчет уникальных элементов в кадре данных Привет Мои данные включают одни и те же элементы несколько раз в столбце, т.е. столбец a a в c a c и все еще в столбце.
У меня странная проблема. Я хочу подсчитать уникальные записи в определенном столбце. Я прикрепил свой файл csv здесь. Я делаю это, чтобы получить уникальные записи в столбце.
В настоящее время у меня есть формула, которая просто подсчитывает уникальные значения в столбце: =SUM(IF(FREQUENCY(A2:A10,A2:A10)>0,1)) Однако я хотел бы подсчитывать их только в том случае, если.
После поиска по форуму я не нашел хорошего решения этой проблемы. Если я пропустил, пожалуйста, дайте мне знать. Мне нужно подсчитать отдельные значения в столбце в EXCEL 2010. Рабочая таблица.
У меня есть 2 листа с информацией о транзакциях за несколько недель назад. Один из них — с этой недели, а другой — с последних недель, для сравнения. Планировка в обоих случаях одинаковая.
Учитывая условное значение в одном столбце, я пытаюсь получить уникальный список значений в другом столбце, используя ‘r’. Например, если на входе было задано sex = M, то на выходе должен получиться список однопометников.
Вы можете отфильтровать данные каждого столбца в электронной таблице MS Excel, нажав на стрелку рядом с его заголовком. Нажав на эту стрелку, Excel показывает список уникальных значений в столбце.
С помощью Java-клиента для эластичного поиска я могу выполнить только один поиск по regex-шаблону. На данный момент я использую следующее. searchSourceBuilder.query(QueryBuilders.regexpQuery(name.
Как показано на следующем изображении, у меня есть электронная таблица с двумя столбцами. Я хочу вывести значение в 3-м столбце как True, если для того же значения в столбце Unique Value оно сравнивается.
Поиск дублей в столбце
Поиск дубликатов в Excel осложняется многими факторами. Могут быть лишние пробелы, пунктуация и изменения слов. Кроме того, пользователь часто ограничивает поиск поиском дубликатов, не удаляя их. Если вы спокойны и готовы избавиться от дубликатов за один шаг, не проверяя их, перейдите на вкладку «Удалить дубликаты».
Иногда вы хотите найти дубликаты в столбце, а иногда — значения, повторяющиеся в другом столбце.
Ситуаций множество, но ключевых моментов всего три:
1. Какие ячейки мы готовы считать дубликатами — все кроме первого или включая его?
2. Считаем ли дублями строки, отличающиеся только пробелами до, после слов или лишними пробелами между словами?
3. Где мы будем искать дубли — внутри текущего диапазона, или производим сравнение с другим диапазоном?
Поэтому давайте начнем с самого начала.
Выделить повторяющиеся значения в Excel цветом
Обычный пользователь Excel часто использует слово «найти» в значении «найти и выделить», когда имеет дело с повторяющимися значениями.
Это идеальный случай для условного форматирования. В Excel есть встроенные правила для условного форматирования, включая правила выбора повторяющихся значений.
Процедура находится на вкладке «Главная»:
Вызовите процедуру условного форматирования, чтобы выбрать повторяющиеся значения
Данная процедура является интуитивно понятной:
- Выберите область, где вы хотите найти дубликаты,
- Вызовите процедуру,
- Выберите форматирование для выбранных ячеек, у вас есть выбор предопределенных форматов, вы также можете выбрать свой вариант
Второй шаг процедуры — выбор цвета заливки и текста.
Обратите внимание, что эта процедура ищет дубликаты во всем диапазоне и поэтому может быть неприменима для сравнения двух столбцов. Достаточно, если в одном столбце есть дубликаты — тогда процедура выделит их оба, даже если в другом столбце их нет:
Условное форматирование меняет цвет дубликатов в столбце
Такое поведение неочевидно, и этот факт часто упускается из виду. В случае следующего удаления повторов вы можете потерять оба варианта в одном столбце.
Что можно сделать, чтобы избежать этой ситуации, если вы хотите найти дубликаты данных в другом столбце? Изначально удалите дубликаты внутри каждого столбца перед добавлением условного форматирования.
Однако есть и другие решения — о них подробнее далее.
Формула проверки наличия дублей в диапазонах
Использование собственной формулы для проверки дубликатов в списке или диапазоне имеет ряд преимуществ. Единственная задача — составить такую формулу. Но я возьму это на себя.
Внутри диапазона
Чтобы проверить, есть ли в диапазоне повторяющиеся значения, можно использовать эту формулу массива:
На практике вот как выглядит применение формулы:
Формула возвращает true, если дубликат появляется в диапазоне адресов
Эта формула полностью повторяет вариант условного форматирования, так в чем же преимущество? — Вы можете спросить.
Дело в том, что эту формулу несложно изменить и улучшить.
Например, вы можете улучшить производительность формулы, добавив к ней функцию ПРОБЕЛ — это позволит вам найти дубликаты, выделяющиеся незаметными лишними пробелами:
Эта формула немного отличается, поскольку она управляет появлением значения одной ячейки в области.
Добавление его в качестве правила выбора условного форматирования позволит вам выявить неявные дубликаты. Наглядная демонстрация показана ниже:
В этой демонстрации есть несколько моментов, на которые стоит обратить внимание:
- Диапазон фиксирован ($A$1:$B$4), но искомая ячейка не фиксирована (A1). Это позволяет с помощью условного форматирования найти все дубликаты в диапазоне
Выделить цветом совпадения из другого столбца/диапазона
Поиск дубликатов с !SEMTools
В свое время у меня было много проблем с приведенными выше методами поиска повторяющихся значений, как внутри столбца, так и при сравнении столбцов, и мне не все из них нравились. В основном это связано с тем, что они длинные.
Поэтому я решил сделать процесс удаления дубликатов максимально быстрым и простым — я создал для этого отдельные процедуры в своем дополнении. Ниже я покажу вам, как они работают.
Найти дубли ячеек внутри диапазона, кроме первого
Найти в диапазоне дубли ячеек, включая первый
Найти дубли без учета лишних пробелов
Если мы считаем фразы, отличающиеся количеством пробелов между словами или после них, дубликатами, то наша задача — сначала избавиться от лишних пробелов, а потом — провести аналогичный поиск пробелов.
Существует отдельный макрос для первой операции — удаления лишних пробелов
Как найти дубли ячеек, не учитывая лишние пробелы