Задачка для интервью

Задачка для интервью

Я вдруг подумал, что такая задачка может сгодится для интервью.
Она абсолютно не математическая, а просто не кодирование, но,
по-моему, может пригодиться (впрочем, я сам не интервьюирую).

Дан текстовый файл, в котором иногда по ошибке встречаются
повторяющиеся друг за другом одинаковые слова.
Например, в тексте "aaa bb cc cc aaa xxx xxx bb cc" такими словами
являются "cc" и "xxx" (a "aaa" и "bb" -- не являются).

Требуется

(а) вывести все такие слова в том порядке,
в котором они встречаются в тексте

(б) вывести вместе с каждым таким словом,
его позицию в тексте и количество повторений.

Для "aaa bb cc cc aaa xxx xxx bb cc" вывод будет
("cc", 2, 2), ("xxx", 5, 2)

Имейте в виду, что файл очень большой и в нём
много разных слов, которые не влезают в память.

Миша


Re: Задачка для интервью

On 12/21/2019 7:56 AM, Mikhail Kimmelman wrote:

Я вдруг подумал, что такая задачка может сгодится для интервью.
Она абсолютно не математическая, а просто не кодирование, но,
по-моему, может пригодиться (впрочем, я сам не интервьюирую).

Дан текстовый файл, в котором иногда по ошибке встречаются
повторяющиеся друг за другом одинаковые слова.
Например, в тексте "aaa bb cc cc aaa xxx xxx bb cc" такими словами
являются "cc" и "xxx" (a "aaa" и "bb" -- не являются).

Требуется

(а) вывести все такие слова в том порядке,
в котором они встречаются в тексте

(б) вывести вместе с каждым таким словом,
его позицию в тексте и количество повторений.

Для  "aaa bb cc cc aaa xxx xxx bb cc" вывод будет
("cc", 2, 2), ("xxx", 5, 2)

Имейте в виду, что файл очень большой и в нём
много разных слов, которые не влезают в память.


Ну, вообще-то в линуксе уже есть команда "uniq".
uniq -c выведет количество повторений.
Правда, позицию не выведет, и по строкам, а не по словам.

Re: Задачка для интервью

Mikhail Kimmelman <mikhail.kimmelman@gmail.com> wrote:

Я вдруг подумал, что такая задачка может сгодится для интервью.
Она абсолютно не математическая, а просто не кодирование, но,
по-моему, может пригодиться (впрочем, я сам не интервьюирую).



Дан текстовый файл, в котором иногда по ошибке встречаются
повторяющиеся друг за другом одинаковые слова.


нахуй. сразу нахуй.
а еще лучше взять интервьюера за грудки и спросить "ты что, ссука, издеваешься, падла?!"

впрочем, есть еще вариант что он просто идиот и/или некомпетентен. в любом случае валить из этого места надо.


Например, в тексте "aaa bb cc cc aaa xxx xxx bb cc" такими словами
являются "cc" и "xxx" (a "aaa" и "bb" -- не являются).



Требуется



(а) вывести все такие слова в том порядке,
в котором они встречаются в тексте



(б) вывести вместе с каждым таким словом,
его позицию в тексте и количество повторений.



Для "aaa bb cc cc aaa xxx xxx bb cc" вывод будет
("cc", 2, 2), ("xxx", 5, 2)



Имейте в виду, что файл очень большой и в нём
много разных слов, которые не влезают в память.



Миша




--
Slawa Olhovchenkov

Re: Задачка для интервью

"Dmitry Krivitsky" wrote in message
news:31d9a086-49d1-3ada-597c-a8b2f6f6f05d@fido.fw.nu...



Я вдруг подумал, что такая задачка может сгодится для интервью.
Она абсолютно не математическая, а просто не кодирование, но,
по-моему, может пригодиться (впрочем, я сам не интервьюирую).


...

Ну, вообще-то в линуксе уже есть команда "uniq".
uniq -c выведет количество повторений.
Правда, позицию не выведет, и по строкам, а не по словам.


Да, верно. Превратить слова в строки , наверное, легко,
а как быть с позицией ?

Миша

Re: Задачка для интервью

"Slawa Olhovchenkov" wrote in message news:qtl65r$11ij$1@ddt.demos.su...


Я вдруг подумал, что такая задачка может сгодится для интервью.
Она абсолютно не математическая, а просто не кодирование, но,
по-моему, может пригодиться (впрочем, я сам не интервьюирую).



Дан текстовый файл, в котором иногда по ошибке встречаются
повторяющиеся друг за другом одинаковые слова.



нахуй. сразу нахуй.
а еще лучше взять интервьюера за грудки и спросить
"ты что, ссука, издеваешься, падла?!"


Почему ? Задачка же совсем не математическая.


впрочем, есть еще вариант что он просто идиот и/или некомпетентен.
в любом случае валить из этого места надо.


Миша

Re: Задачка для интервью

Mikhail Kimmelman <mikhail.kimmelman@gmail.com> wrote:

"Slawa Olhovchenkov" wrote in message news:qtl65r$11ij$1@ddt.demos.su...




Я вдруг подумал, что такая задачка может сгодится для интервью.
Она абсолютно не математическая, а просто не кодирование, но,
по-моему, может пригодиться (впрочем, я сам не интервьюирую).





Дан текстовый файл, в котором иногда по ошибке встречаются
повторяющиеся друг за другом одинаковые слова.





нахуй. сразу нахуй.
а еще лучше взять интервьюера за грудки и спросить
"ты что, ссука, издеваешься, падла?!"




Почему ? Задачка же совсем не математическая.


поотму что задача очень геморойная.
ключевые слова:

руны
глифы
вьетнамские тоны
управляющие конструкции
различные виды юникод-нормализации
grapheme clusters

"нельзя utf8 строку парсить символами, это вообще не строка, это, скорее, байт-код, где каждая инструкция может занимать произвольное количество байт. Его нужно сначала интерпретировать (отрендерить), и только потом" что-то делать.

"Фокус в том, что символ "~n" в юникоде ты можешь представить либо одной кодовой позицией, либо двумя: символом "n" и модификатором, проставляющим волнистый тон. Есть различные виды юникод-нормализации, которые либо "схлопывают" такие последовательности, либо "расклеивают" их, наоборот (иначе ты даже сравнить две строки на эквивалентность не можешь)."



впрочем, есть еще вариант что он просто идиот и/или некомпетентен.
в любом случае валить из этого места надо.




Миша



--
Slawa Olhovchenkov

Re: Задачка для интервью

On 12/21/19 12:56 PM, Mikhail Kimmelman wrote:

Я вдруг подумал, что такая задачка может сгодится для интервью.
Она абсолютно не математическая, а просто не кодирование, но,
по-моему, может пригодиться (впрочем, я сам не интервьюирую).

Дан текстовый файл, в котором иногда по ошибке встречаются
повторяющиеся друг за другом одинаковые слова.


Сразу ответ: жид просто не попал в МГУ и теперь мстит всем,
вспоминая про "гробы", про которые ему такие же жиды рассказывали, когда
он готовился поступить в МГУ.

Re: Задачка для интервью

On 12/21/19 2:43 PM, avi wrote:

On 12/21/19 12:56 PM, Mikhail Kimmelman wrote:

Я вдруг подумал, что такая задачка может сгодится для интервью.
Она абсолютно не математическая, а просто не кодирование, но,
по-моему, может пригодиться (впрочем, я сам не интервьюирую).

Дан текстовый файл, в котором иногда по ошибке встречаются
повторяющиеся друг за другом одинаковые слова.


   Сразу ответ: жид просто не попал в МГУ и теперь мстит всем,
вспоминая про "гробы", про которые ему такие же жиды рассказывали, когда
он готовился поступить в МГУ.


еще добавлю: если уж этого киммельмана не получилось стать тем, кто
попал в МГУ, то надо попробовать стать тем, кто не дал попасть в МГУ.
Типа: "It's better to be a fake somebody than a real nobody".

Re: Задачка для интервью

On 12/21/2019 7:56 AM, Mikhail Kimmelman wrote:


Жениться бы вам барин ... тьфу сходить на www.hackerrank.com




Дан текстовый файл, в котором иногда по ошибке встречаются
повторяющиеся друг за другом одинаковые слова.
Например, в тексте "aaa bb cc cc aaa xxx xxx bb cc" такими словами
являются "cc" и "xxx" (a "aaa" и "bb" -- не являются).

Требуется

(а) вывести все такие слова в том порядке,
в котором они встречаются в тексте

(б) вывести вместе с каждым таким словом,
его позицию в тексте и количество повторений.

Для  "aaa bb cc cc aaa xxx xxx bb cc" вывод будет
("cc", 2, 2), ("xxx", 5, 2)




Имейте в виду, что файл очень большой и в нём
много разных слов, которые не влезают в память.



Эта задачка излишне простая и исполняется в один проход - храним
предыдущее слово и сравниваем с текущим.

При этом она совершенно не практичная.
В реальной жизни нужна полная дедупликация всего файла.



Я вдруг подумал, что такая задачка может сгодится для интервью.


А не проще просто попросить кандидата отжаться от пола XX раз?


Bye, Anatol

Re: Задачка для интервью

On Saturday, December 21, 2019 at 7:56:45 AM UTC-5, Mikhail Kimmelman wrote:

Я вдруг подумал, что такая задачка может сгодится для интервью.
Она абсолютно не математическая, а просто не кодирование, но,
по-моему, может пригодиться (впрочем, я сам не интервьюирую).

Дан текстовый файл, в котором иногда по ошибке встречаются
повторяющиеся друг за другом одинаковые слова.
Например, в тексте "aaa bb cc cc aaa xxx xxx bb cc" такими словами
являются "cc" и "xxx" (a "aaa" и "bb" -- не являются).

Требуется

(а) вывести все такие слова в том порядке,
в котором они встречаются в тексте

(б) вывести вместе с каждым таким словом,
его позицию в тексте и количество повторений.

Для "aaa bb cc cc aaa xxx xxx bb cc" вывод будет
("cc", 2, 2), ("xxx", 5, 2)

Имейте в виду, что файл очень большой и в нём
много разных слов, которые не влезают в память.

Миша


На какую позицию интервьюируем?

Re: Задачка для интервью

On Saturday, December 21, 2019 at 11:16:28 AM UTC-5, D wrote:

On 12/21/2019 7:56 AM, Mikhail Kimmelman wrote:


Жениться бы вам барин ... тьфу сходить на www.hackerrank.com




Дан текстовый файл, в котором иногда по ошибке встречаются
повторяющиеся друг за другом одинаковые слова.
Например, в тексте "aaa bb cc cc aaa xxx xxx bb cc" такими словами
являются "cc" и "xxx" (a "aaa" и "bb" -- не являются).

Требуется

(а) вывести все такие слова в том порядке,
в котором они встречаются в тексте

(б) вывести вместе с каждым таким словом,
его позицию в тексте и количество повторений.

Для  "aaa bb cc cc aaa xxx xxx bb cc" вывод будет
("cc", 2, 2), ("xxx", 5, 2)




Имейте в виду, что файл очень большой и в нём
много разных слов, которые не влезают в память.



Эта задачка излишне простая и исполняется в один проход - храним
предыдущее слово и сравниваем с текущим.


Теоретически может быть use case: мы просим написать код и нас интересует не идея решения, а почерк. Но опять таки, на какую позицию интервьюируем?

Мы иногда юниорам подобное подкидываем, но там сразу алгоритм расписан прямо в условии, остается только писать код.

Re: Задачка для интервью

"Slawa Olhovchenkov" wrote in message news:qtl9us$1gqv$1@ddt.demos.su...



Дан текстовый файл, в котором иногда по ошибке встречаются
повторяющиеся друг за другом одинаковые слова.





нахуй. сразу нахуй.
а еще лучше взять интервьюера за грудки и спросить
"ты что, ссука, издеваешься, падла?!"




Почему ? Задачка же совсем не математическая.



поотму что задача очень геморойная.
ключевые слова:

...

Да, точно. Я про эти все дела всё время забываю.

Миша

Re: Задачка для интервью

"D" wrote in message news:qtlggq$o1h$1@dont-email.me...


Эта задачка излишне простая и исполняется в один проход - храним
предыдущее слово и сравниваем с текущим.


Да, соглашусь, пожалуй. Задачка неудачная.


При этом она совершенно не практичная.
В реальной жизни нужна полная дедупликация всего файла.


Миша

Re: Задачка для интервью

"GM" wrote in message
news:4bb959ef-137b-470a-910c-54caed337132@googlegroups.com...



Я вдруг подумал, что такая задачка может сгодится для интервью.
Она абсолютно не математическая, а просто не кодирование, но,
по-моему, может пригодиться (впрочем, я сам не интервьюирую).


...

На какую позицию интервьюируем?


На программиста.
Но я уже понял, что задачка неудачная.

Миша

Re: Задачка для интервью

"GM" wrote in message
news:32935feb-ed33-4547-8575-08dee6b828c0@googlegroups.com...



Эта задачка излишне простая и исполняется в один проход - храним
предыдущее слово и сравниваем с текущим.


Теоретически может быть use case: мы просим написать код
и нас интересует не идея решения, а почерк. Но опять таки,
на какую позицию интервьюируем?

Мы иногда юниорам подобное подкидываем, но там сразу алгоритм
расписан прямо в условии, остается только писать код.


Вот кстати, да. Нужно же какое-то упражнение на кодирование.
Но когда алгоритм уже расписан, это всё-таки не очень интересно.

Миша

Re: Задачка для интервью

Mikhail Kimmelman <mikhail.kimmelman@gmail.com> wrote:

"GM" wrote in message
news:32935feb-ed33-4547-8575-08dee6b828c0@googlegroups.com...





Эта задачка излишне простая и исполняется в один проход - храним
предыдущее слово и сравниваем с текущим.


Теоретически может быть use case: мы просим написать код
и нас интересует не идея решения, а почерк. Но опять таки,
на какую позицию интервьюируем?

Мы иногда юниорам подобное подкидываем, но там сразу алгоритм
расписан прямо в условии, остается только писать код.




Вот кстати, да. Нужно же какое-то упражнение на кодирование.
Но когда алгоритм уже расписан, это всё-таки не очень интересно.


пускай квадратное уравнение решит.
там и потрахаться можно и объем не большой, и есть уверенность что не станут твоими трудами нахаляву пользоваться.


--
Slawa Olhovchenkov

Re: Задачка для интервью

On Sunday, December 22, 2019 at 1:35:57 AM UTC-5, Mikhail Kimmelman wrote:

"GM" wrote in message
news:4bb959ef-137b-470a-910c-54caed337132@googlegroups.com...



Я вдруг подумал, что такая задачка может сгодится для интервью.
Она абсолютно не математическая, а просто не кодирование, но,
по-моему, может пригодиться (впрочем, я сам не интервьюирую).


...

На какую позицию интервьюируем?


На программиста.


Издеваетесь, да?


Но я уже понял, что задачка неудачная.

Миша


Re: Задачка для интервью

"GM" wrote in message
news:70154a67-187b-46b5-a90a-31c4379739eb@googlegroups.com...





Я вдруг подумал, что такая задачка может сгодится для интервью.
Она абсолютно не математическая, а просто не кодирование, но,
по-моему, может пригодиться (впрочем, я сам не интервьюирую).


...

На какую позицию интервьюируем?


На программиста.


Издеваетесь, да?


Да нет, почему.
Просто задачка неудачная.

Миша