Типовые ошибки Python-разработчиков на собеседованиях / forpes.ru

Главная
Типовые ошибки Python-разработчиков на собеседованиях

Типовые ошибки Python-разработчиков на собеседованиях +22

08.12.2020 08:00

aranax 53 15900 Источник

Всем привет, сегодня я хотел бы поговорить о некоторых сложностях и заблуждениях, которые встречаются у многих соискателей. Наша компания активно растет, и я часто провожу или участвую в проведении собеседований. В итоге я выделил несколько вопросов, которые многих кандидатов ставят в сложное положение. Давайте вместе рассмотрим их. Я опишу специфические вопросы для Python, но в целом статья подойдет для любого собеседования. Для опытных разработчиков никаких истин тут открыто не будет, но тем, кто только начинает свой путь, будет легче определиться с темами на ближайшие несколько дней.

Отличие процессов от потоков в Linux

Ну вы знаете, такой типичный и, в целом, несложный вопрос, чисто на понимание, без копания в деталях и тонкостях. Конечно, большинство соискателей расскажет, что потоки более легковесны, между ними быстрее переключается контекст, и вообще они живут внутри процесса. И всё это правильно и замечательно, когда мы говорим не о Linux. В ядре Linux потоки реализованы так же, как и обычные процессы. Поток— это просто процесс, который использует некоторые ресурсы совместно с другими процессами.

Для создания процессов в Linux можно использовать два системных вызова:

clone(). Это основная функция для создания дочерних процессов. С помощью флагов разработчик указывает, какие структуры родительского процесса должны быть общими с дочерним. Базово используется для создания потоков (имеют общее адресное пространство, файловые дескрипторы, обработчики сигналов).
fork(). Эта функция используется для создания процессов (которые имеют собственное адресное пространство), но под капотом вызывает clone() с определенным набором флагов.

Я бы обратил внимание на следующее: когда вы сделаете fork() процесса, вы не сразу получите копию памяти родительского процесса. Ваши процессы будут работать с единым экземпляром в памяти. Поэтому, если суммарно у вас должно было случиться переполнение памяти, то всё продолжит работать. Ядро пометит дескрипторы страниц памяти родительского процесса как «только для чтения», а при попытке записи в них (дочерним или родительским процессом) будет вызвано и обработано исключение, которое вызовет создание полной копии. Этот механизм называется Copy-on-Write.

Отличной книгой об устройстве Линукса я считаю «Linux. Системное программирование» за авторством Роберта Лава.

Проблемы с Event Loop

В нашей компании повсеместно распространены асинхронные сервисы и воркеры на Python или Go. Поэтому мы считаем важным общее понимание асинхронности и работы Event Loop. Многие кандидаты уже довольно неплохо отвечают на вопросы о плюсах асинхронного подхода и правильно представляют Event Loop как некий бесконечный цикл, который позволяет понять, не пришло ли определенное событие от операционной системы (например, запись данных в сокет). Но не хватает связующего элемента: как программа получает эту информацию от операционной системы?

Конечно, самое простое, что можно вспомнить — это Select. С его помощью формируется список файловых дескрипторов, за которыми планируется наблюдать. В клиентском коде придется проверять все переданные дескрипторы на наличие событий (и их количество ограничено 1024), что делает его медленным и неудобным.

Ответа про Select более чем достаточно, но если вы вспомните про Poll или Epoll, и расскажете о проблемах, которые они решают, то это будет большим плюсом к вашему ответу. Чтобы не вызывать лишних волнений: код на C и детальную спецификацию у нас не спрашивают, мы говорим лишь о базовом понимании происходящего. Прочитать про различия Select, Poll и Epoll можно в этой статье.

Еще советую посмотреть на тему асинхронности в Python Девида Бизли.

GIL защищает, но не вас

Еще одно распространенное заблуждение заключается в том, что GIL придумали, чтобы защитить разработчиков от проблем с конкурентным доступом к данным. Но это не так. GIL, конечно, не даст вам распараллелить программу с помощью потоков (но не процессов). Проще говоря, GIL — это блокировка, которая должна быть взята перед любым обращением к Python (не так важно. исполняется Python-код или вызовы Python C API). Поэтому GIL защитит внутренние структуры от неконсистентных состояний, но вам, как и в любом другом языке, придется использовать примитивы синхронизации.

Также говорят, что GIL нужен только для корректной работы GC. Для неё он, конечно, нужен, но этим дела не ограничиваются.

С точки зрения исполнения даже самая простая функция будет разбита на несколько шагов:

import dis

def sum_2(a, b):
    return a + b

dis.dis(sum_2)


4           0 LOAD_FAST                0 (a)
             2 LOAD_FAST                1 (b)
             4 BINARY_ADD
             6 RETURN_VALUE

С точки зрения процессора каждая из этих операций не является атомарной. Python выполнит очень много процессорных инструкций на каждую строчку байт-кода. При этом нельзя давать другим потокам изменять состояние стека или производить любую другую модификацию памяти, это приведет к Segmentation Fault или некорректному поведению. Поэтому интерпретатор запрашивает глобальную блокировку на выполнение каждой инструкции байт-кода. Однако между отдельными инструкциями контекст может быть изменен, и тут GIL нас никак не спасает. Подробнее про байт-код и как с этим работать можно почитать в документации.

На тему защиты GIL посмотрите простой пример:

import threading

a = 0
def x():
    global a
    for i in range(100000):
        a += 1

threads = []

for j in range(10):
    thread = threading.Thread(target=x)
    threads.append(thread)
    thread.start()

for thread in threads:
    thread.join()

assert a == 1000000

На моей машине ошибка вылетает стабильно. Если вдруг у вас оно не отработает, то запустите несколько раз или добавьте тредов. При небольшом количестве тредов вы получите плавающую проблему (ошибка то появляется, то не появляется). То есть помимо некорректности данных у таких ситуаций есть еще проблема в виде ее плавающего характера. Также это подводит нас к следующей проблеме: примитивам синхронизации.

И опять не могу не сослаться на Девида Бизли.

Примитивы синхронизации

В целом, примитивы синхронизации — не самый лучший вопрос для Python, но они показывают общее понимание проблемы и то, насколько глубоко вы копали в эту сторону. Тема многопоточности, по крайней мере у нас, спрашивается как бонусная, и будет только плюсом (если вы ответите). Но ничего страшного, если вы с ней еще не сталкивались. Можно сказать, что этот вопрос не привязан к конкретному языку.

Многие начинающие питонисты, как я уже писал выше, надеются на чудотворную силу GIL, поэтому в тему примитивов синхронизации не заглядывают. А зря, это может пригодится при выполнении фоновых операций и задач. Тема примитивов синхронизации большая и хорошо разобранная, в частности, рекомендую почитать об этом в книге «Core Python Applications Programming» автора Wesley J. Chun.

И раз мы уже посмотрели пример, где нам нам не помог GIL в работе с потоками, то рассмотрим самый простой пример, как защититься от подобной проблемы.

import threading
lock = threading.Lock()

a = 0
def x():
    global a
    lock.acquire()
    try:
        for i in range(100000):
            a += 1
    finally:
        lock.release()

threads = []

for j in range(10):
    thread = threading.Thread(target=x)
    threads.append(thread)
    thread.start()

for thread in threads:
    thread.join()

assert a == 1000000

Retry всему голова

Никогда нельзя полагаться на то, что инфраструктура будет всегда стабильно работать. На собеседованиях мы часто просим спроектировать простой микросервис, взаимодействующий с другими (например, по HTTP). Вопрос стабильности сервиса иногда сбивает кандидатов с толку. Я бы хотел обратить внимание на несколько проблем, которые кандидаты не учитывают, когда предлагают делать retry по HTTP.

Первая проблема: сервис может просто не работать продолжительное время. Повторные запросы в реальном времени будут бессмысленны.

Retry, сделанные неаккуратно, могут добить сервис, который начал замедляться под нагрузкой. Меньшее, что ему нужно, это увеличение нагрузки, которая за счет повторных запросов может вырасти в разы. Нам всегда интересно обсудить методы сохранения состояния и осуществления досылки после того, как сервис начнет работать штатно.

Как вариант, можно попытаться сменить протокол с HTTP на что-то с гарантированной доставкой (AMQP и т. д.).

Еще задачу retry может взять на себя service mesh. Подробнее можно почитать в этой статье.

В целом, как я и говорил, никаких сюрпризов тут нет, но эта статья может помочь вам понять, какие темы следует подтянуть. Не только для прохождения собеседований, но и для более глубокого понимания сути происходящих процессов.

Комментарии (53)

oleg_gavrilov
08.12.2020 11:30
#22398318
Как вариант, можно попытаться сменить протокол с HTTP на что-то с гарантированной доставкой (AMQP и т. д.).

А как, по вашему, гарантированная доставка в AMPQ работает, если не через retry? Звучит так, как будто вы предлагаете спрятать проблему ретраев на нагруженный сервис в черный ящик, и представить что таким образом всё само заработает.
1. aranax Автор
  08.12.2020 12:03
  #22398474
  Есть типовые решения для определенных сценариев. Пользоваться или нет это выбор каждого в каждом конткретном случаи. Будет ли это черным ящиком зависит от того насколько вы захотите разобраться в том как это работает.
  1. InteractiveTechnology
    08.12.2020 22:28
    #22400916
    В данном примере должен быть circuit breaker

t13s
08.12.2020 11:31
#22398320
+3
Кажется, статья должна называться «Типовые ошибки на техническом собеседовании в ДомКлик».
Потому что иначе вообще непонятно, о чем речь, при чем тут типовое собеседование и, скажем, GIL (а что это, кстати?).
1. aranax Автор
  08.12.2020 12:04
  #22398478
  Наверное вы правы. Подумаю как изменить заголовок. Хотя тут скорее на собеседованиях python разработчиков, чем именно в ДоиКлик
  1. sshikov
    08.12.2020 18:01
    #22400090
    >Я опишу специфические вопросы для Python, но в целом статья подойдет для любого собеседования.
    Вряд ли. Для любого собеседования некоторые вопросы тут вообще не имеют смысла.
  1. icecube092
    09.12.2020 11:46
    #22402468
    Я опишу специфические вопросы для Python
    
    Отличие процессов от потоков в Linux
    
    И даже если взять остальные вопросы, то например меня на собеседованиях про threading ни разу не спрашивали, асинхронность — да, потоки — нет. GIL — ок. Retry — не совсем питонский вопрос.
1. slonopotamus
  09.12.2020 00:19
  #22401260
  А ошибка-то в чём? В питоне или ДомКлике?
  1. t13s
    09.12.2020 00:38
    #22401312
    В том, что статья раньше немножко по-другому называлась, и потому когнитивный диссонанс вырабатывался в бoльших количествах.

prostofilya
08.12.2020 12:46
#22398690
Так и в чём отличие процессов от потоков в linux? Не нашёл ответа в статье
1. aranax Автор
  08.12.2020 13:18
  #22398834
  +1
  В ядре Linux потоки реализованы так же, как и обычные процессы. Поток— это просто процесс, который использует некоторые ресурсы совместно с другими процессами.
  Глубоко копать в тему в рамках этой статьи не планировал.

Yuribtr
08.12.2020 13:22
#22398856
Простите, это примеры знаний которые должен иметь джун без опыта чтобы к вам попасть? Спасибо
1. aranax Автор
  08.12.2020 13:28
  #22398890
  Нет. Это просто то, что часто проскакивает на собеседованиях

andyN
08.12.2020 16:11
#22399680
Я прочитал начало и выпал в осадок. Как знание Linux связано с Python? Это вообще из другой области. Читал дальше и падал все ниже. Как AMQP связан с Python? Это про архитектуру в целом, к языку не относится вообще никак. Вы уж определитесь, вам нужен DevOps, System Architect, Linux/System developer или таки пайтон разработчик?
Я очень надеюсь что вы не относитесь к той компании, в которой у разработчика на React спрашивают сколько регистров у 486 CPU
1. aranax Автор
  08.12.2020 16:29
  #22399748
  Есть вопросы на конкретный язык, есть вопросы на общие знания. По linux вопросы задаются не каждому кандидату и не у каждой команды, все зависит от позиции и специфики задач.
  Что касается amqp, то в проектировании конечных решений участвует вся команда, а не 1 архитектор, поэтому мы и задаем такие вопросы.
  1. andyN
    09.12.2020 19:21
    #22404688
    +1
    Тогда статью следовало бы назвать как-то вроде «Мы собеседуем людей на весьма специфическую должность, и вот вопросы на которые они не отвечают».
    ИМХО системные программисты вам подошли бы намного лучше. Особенности форков и прочего — это же родная для системных C++ разработчиков среда. Ну и плюс AMQP тут как пристройка какая-то сбоку. Пайтон — это высокоуровневый язык, он специально создавался чтобы не думать о том что там творится под капотом на уровне OS. Более того, часто такое знать даже вредно, ибо невозможно знать вообще всё в IT, и избыток непрофильных знаний у кандидатов довольно часто означает недостаток профильных.
    
    shishmakov
    11.12.2020 15:42
    #22412114
    Пайтон — это высокоуровневый язык, он специально создавался чтобы не думать о том что там творится под капотом на уровне OS
    
    человек, который ограничивает свои знания такими заявлениями ограничивает себя и в профессиональном росте. Плох тот Junior, который не хочет стать Senior. Вы от Senior тоже такого ответа будете ждать?
    
    tyomitch
    11.12.2020 16:05
    #22412238
    От Senior кого? Senior питониста, или Senior системщика?
    
    shishmakov
    11.12.2020 17:13
    #22412514
    Senior Python Software Engineer
    
    tyomitch
    11.12.2020 17:33
    #22412602
    Писать макросы для Excel и оптимизировать SQL-запросы Senior Python Software Engineer тоже должен уметь?
    
    shishmakov
    11.12.2020 17:38
    #22412632
    Excel не входит в стек используемых технологий разработки ПО, по крайней мере не этого блога. Базы данных входят в стек и поэтому да должен. Если программист пишет SQL — запрос то интересоваться, что выводит explain и как долго исполняется запрос, какие индексы задействованы, его обязанность.
    
    andyN
    11.12.2020 18:09
    #22412744
    В какой такой стек входит SQL у питониста? Который, к примеру, кодит нейросети? Или который на бигдату собеседуется? Или который последние 5 лет работал только с ORM? Питон — это не только веб, уже давно не. То что там у кого-то в блоке\компании требуется, это их частный случай, и я бы очень посоветовал им обновить название вакансии, чтобы люди не тратили на неё время. Я об этом выше и написал.
    Вы немного перепутали причинно-следственную связь. Питонист пришел на собеседование и на него там посыпались вопросы по особенностям реализации форков процессов в определенной операционной системе. Это НЕ его профильная область. Он может интересоваться ей, а может и не интересоваться, вместо этого интересуясь разведением хомячков в тундре или новыми фичами в Vue.JS (кстати, 2 последних также удалены от классической сферы питон-разраба, как и первое). Допустим вы его загрузили непрофильными вопросами и он ушел. Да, он может потом загуглить ваши форки в линуксе, но какой от этого толк? Он уже ушел, вы потратили время, он потратил время. Ситуация диаметрально противоположная от win-win
    
    shishmakov
    11.12.2020 18:15
    #22412764
    Это уже не диалог, а демагогия. У любой вакансии есть не только заголовок, но и список задач, стек используемых технологий.
    
    Что вы мне хотите донести: что программист с БД не умеет работать? Увольте, в таком диалоге я не буду участвовать
    
    YuriM1983
    11.12.2020 23:22
    #22413630
    Пытаюсь вспомнить, как мне пригодились таблицы прерываний Ральфа Брауна, а также функции C-WinAPI, которые я изучал 20 лет назад, при программировании на питоне…
    Неужели это сениору так нужно?
1. Insurgent2018
  09.12.2020 09:24
  #22401956
  абстрагироваться от темы, наверно вы правы, действительно, как знание принципов работы двигателей внутреннего сгорания, или электродвигателей связано с управлением средствами передвижения, на которых эти двигатели установлены.
  Наверно просто время такое.

Tsimur_S
08.12.2020 17:21
#22399938
Честно говоря все это похоже на какой то сюр, заходишь почитать про специфику вкатывания в Python а тут с порога: нюансы GIL, кишки Линукса. Точно подходящий инструмент для хайлоада?
1. aranax Автор
  08.12.2020 17:27
  #22399952
  Смотря что считать хайлоадом. Большинству проектов хватит с запасом при правильном использовании. А с учетом удобства и скорости разработки, хороший инструмент для многих задач, выключая вполне нагруженные сервисы. Быстрее чем на go или c++ не будет работать.
  1. pnp2000
    08.12.2020 19:33
    #22400416
    А зачем? Когда даже PHP выглядит намного лучше, хотя конечно можно backend и на bash’е написать.
    
    aranax Автор
    08.12.2020 19:42
    #22400452
    это очень спорный вопрос. все зависит от того чем вы привыкли пользоваться и задачи которую решаете.
    
    pnp2000
    08.12.2020 20:14
    #22400546
    Ну как спорный, вполне очевидна разница https://benchmarksgame-team.pages.debian.net/benchmarksgame/fastest/php-python3.html
    Хотя я PHP не люблю, впрочем как и Java, да и Python отношусь прохладно, как скриптовый язык ещё более-менее, а для backend’а есть варианты на порядок лучше.
    
    Kwisatz
    08.12.2020 21:47
    #22400796
    А именно? Чисто из любопытства
    
    pnp2000
    09.12.2020 00:23
    #22401274
    Зависит от требований, если High load то вариантов немного, C/C++ или Rust, дёшево и сердито Go, если минимум денег то PHP.
    
    Kwisatz
    09.12.2020 00:34
    #22401304
    ясно, спс, уж лучше сразу яву тогда или c#
    
    pnp2000
    09.12.2020 03:48
    #22401550
    За Java надо руки отрубать по самые яйки, топ в моём списке самых отстойных ЯП.
    
    Rive
    09.12.2020 10:05
    #22402094
    Чем она вам не нравится?
    
    pnp2000
    09.12.2020 10:26
    #22402180
    Да всем, тяжелая, жрёт памяти как не в себе, что поддержка сервисов на серверах, что на мобильных девайсах, вот зачем Google выбрал это **** для Android?
    Даже пришлось перейти на Iphone, потому что был Galaxy Note 10 и с нужными мне приложениями он постоянно перегревался и по сути не работал, беспроводная зарядка вообще не работала, она постоянно отключалась из-за перегрева, доходило до того что и проводная не работала, вот он пишет тебе «заряд критический, срочно подключите зарядку», ты подключаешь и он пишет тебе «зарядка невозможна из-за перегрева», ты отключаешь зарядку и он снова пишет тебе «заряд критический, срочно подключите зарядку», прям вот хочется сказать, ты сцуко определись что тебе надо?
    В итоге взял 11 PRO и все те-же приложения при той же температуре «за бортом» работают на ура, и беспроводная зарядка почти всегда работает, да iPhone тоже перегревается, но разница между иногда и почти всегда просто огромная, про то что на Android нет навигации и конкретно в Note 10 глючный GPS отдельная тема которая Java уже не касается. Просто на IOS пишут либо на Obj-C (ещё та дичь) и Swift, которые на порядок лучше по энергоэффективности.
    Например очень наглядный пример Swift versus Java
    Конечно на regex-redux есть аномалия, но возможно код не очень оптимальный написали, потому что во всех других сценариях мы видим что Java медленней и жрёт заметно больше памяти.
    
    Tsimur_S
    09.12.2020 12:55
    #22402758
    Даже пришлось перейти на Iphone, потому что был Galaxy Note 10 и с нужными мне приложениями он постоянно перегревался и по сути не работал, беспроводная зарядка вообще не работала, она постоянно отключалась из-за перегрева
    
    Ну 7е ноты вообще самопроизвольно возгорались, их даже запретили проносить на борт самолетов. Думаете дело в Java?
    
    Конечно на regex-redux есть аномалия, но возможно код не очень оптимальный написали
    
    Ничего страшного, ведь считать n-problem или рассчитывать множество мандельброта нужно гораздо чаще чем применять регеэкспы.
    
    потому что во всех других сценариях мы видим что Java медленней
    
    Особенно хорошо это видно в тестах binary-trees, k-nucleotide, fasta.
    
    pnp2000
    09.12.2020 19:46
    #22404796
    1 — На Note 7 был дефект баттареи, дефекты у всех бывают, даже Apple от этого много раз страдал, а они стараются очень аккуратно подходить к поставщикам компонентов.
    2 — Тут основная задача посмотреть как работает сборщик мусора и оптимизатор, поэтому в этом тесте нет ничего связанного с IO, типа SQL и т.д.
    3 — В fasta разница мизерная, зато памяти Java съедено почти в 2 раза больше.
    Ну и конечно mandelbrot, fannkuch-redux, n-body, spectral-norm, pidigits мы видим что при почти равном времени имполнения, памяти Swift'ом съедено заметно меньше.
    PS: Я не топлю за Samsung, пришлось купить потому что особого выбора тут нет. Я не топлю за Swift, не очень мне нравится его синтаксис, но это вкучовщина конечно, взял его для сранения потому что даёт общее представление в понимании скорости ПО в Android vs IOS
    
    Tsimur_S
    09.12.2020 20:35
    #22404996
    1) так может galaxy note 10 греется из-за неудавной батареи/контроллера и процессора либо кривизны рук Samsung разработчиков/проектировщикова не из-за того используется Java?
    
    2) Как только тесты перешли от написания кода в С стиле(посмотрите свифтовые исходники первых трех с UnsafeMutablePointer) к использованию регеэксп либы то почему то Swift резко ударил лицом в грязь.
    
    3) В fasta разница мизерная зато в binary-trees она пятикратная а в k-nucleotide трехкратная. Их вы предпочли проигнорировать. В чем же возможная причина? Общего между ними — использована пакетная либа платформы Foundation для многопоточности, а в Java аналогичные пакеты.
    
    Итого в сухом остатке — если использовать встроеные в плаформы либы то почему то пропадает куда-то вся дутая производительность.
    
    памяти Swift'ом съедено заметно меньше
    
    Это да, есть такая беда у Java — съедать всю доступную память. С другой стороны выбирая между временем выполнения и памятью лучше выбрать время, оно стоит дороже.
    
    PS Прекрасно представляю что из себя представляет Android изнутри и именно поэтому считаю что превзойти iOS по производительности это несбыточная задача.
    
    Apple контролирует абсолютно все этапы работы приложения:
    1) они задизайнили процессор на котором он будет работать и остальное железо
    2) они целиком создали тулчейн на котором приложение будет собираться и разрабатываться
    3) все драйвера и ядро операционной системы написаны ими же.
    4) системные библиотеки платформы(рантайм языка приложений) точно так же полностью сделаны Apple
    5) жестокий фильтр приложений, в том числе по признаку user experience и производительности.
    У Google как «владельца» Android из этого есть контроль только над п4 и отчасти п2.
    Железо клепают производители, они же пишут драйвера кто во что горазд. В сторе миллион приложений совершенно разного качества, практически без всякого контроля UX.
    Я совершенно уверен что если бы Android использовал swift(go,c++,rust) для написаний приложений а iOS Java, то все равно ситуация была бы точно такой же.
    
    pnp2000
    10.12.2020 05:32
    #22406078
    1 — Конечно, «Жава неуиновен»
    2 — Думаю потому что Apple не особенно оптимизирует версию под Linux.
    3 — Не игнорирую, но большая часть тестов не в пользу Java, по поводу тестов где Swift «сливает», думаю тут причина выше, в п.2, т.к. за пределами экосистемы Apple Swift крайне мало используют.
    По поводу следующего перечисления, Google может контролировать 2,4,5 и частично 3.
    На Android можно писать в NDK, но мало кто этим замарачивается.
    
    Kwisatz
    09.12.2020 10:50
    #22402280
    За большие приложения на go лучше тогда сразу убивать. За приложения реального времени на php -тоже.
    
    pnp2000
    09.12.2020 11:17
    #22402376
    Конечно конечно, срочно запретить Docker, Kubernetes и т.д.
    ps: а для приложний реального времени нужно писать их под нормальные Hard-RTOS системы.
    
    Tsimur_S
    09.12.2020 12:27
    #22402636
    Ага ну да конечно, user space они же green треды из коробки(смысл вопроса про разницу kernel thread vs kernel process пропадает), внятная и стандартизированная memory model безо всяких GIL уже 20 лет как, неблокирующий IO из коробки(NIO), netty сервер для хайлоада(уже даже поддержку io_uring запилили), тонны потокобезопасных коллекций и примитивов синхронизации на любой вкус, огромное количество экспертизы размазанной по не менее огромному комьюнити, требования по знанию многопоточности предъявляются к разработчикам начиная еще с джуниор уровня.
    
    Ну да Python прям смотрится на фоне Java явным фаворитом для highload.
    
    pnp2000
    09.12.2020 19:30
    #22404722
    Да о чём тут говорить, для Нighload они оба не подходят, хотя если под Нighload понимать макимальную загрузку сервера то в принципе Java нормас.
    
    andyN
    09.12.2020 19:23
    #22404696
    +1
    На Java написано огромное количество отличного софта, от Cassandra до много чего в экосистеме того же Hadoop. Помимо очевидных минусов, у нее огромное количество плюсов, включая библиотеки на любой вкус, большое количество кандидатов на рынке труда и так далее.
    
    pnp2000
    09.12.2020 19:36
    #22404752
    Если про рынок труда то PHP тут к сожалению рулит, если говорить про библиотеки то до С++ ей как раком до Пекина.
    И для меня её минусы превышают плюсы, как я уже писал поддержка сервисов на Java всегда доставляла намного боьше проблем чем на всех других плаформах.

1801BM1
08.12.2020 19:45
#22400460
+1
>>Поток— это просто процесс, который использует некоторые ресурсы совместно с другими >>процессами.
Э-э… Это шутка такая, да?
В первую очередь (помимо других ресурсов), процесс обладает набором страниц памяти, он предоставляет «песочницу» для исполнения приложения. А поток — это, в первую очередь, контекст исполнения, предоставляет регистры процессора и стек. Это как-бы общепринятая терминология, в подавляющем большинстве ОС это так, и Linux тут не исключение.
1. aranax Автор
  08.12.2020 19:54
  #22400490
  В ядре Linux потоки реализованы так же, как и обычные процессы. Поток— это просто процесс, который использует некоторые ресурсы совместно с другими процессами.
  
  Речь идет о том, что нет отдельной реализации для потоковв операционной системе. Поведение согласно тому, что вы описываете получить можно, с этим нет никаких проблем
  1. 1801BM1
    08.12.2020 21:42
    #22400768
    +3
    Речь о том что надо быть аккуратным с терминологией. Процесс и поток — это совершенно разные сущности, и предложение «Поток— это просто процесс» от соискателя на собеседовании сразу напрягает и триггерит дополнительные вопросы на понимание конекстов памяти и контекста исполнения.
  1. tyomitch
    09.12.2020 10:46
    #22402256
    +1
    Ваши представления о Linux устарели 17 лет назад: en.wikipedia.org/wiki/Native_POSIX_Thread_Library

Redrik05
08.12.2020 20:48
#22400636
Аж захотелось устроиться в домклик. встретимся через год)

YuriM1983
09.12.2020 10:16
#22402138
Я правильно понимаю, что знание особенности «подкапотной» реализации потоков питона на Linux важно только, если создаёшь глобальные объекты на сотни мегабайт?
1. aranax Автор
  09.12.2020 10:27
  #22402186
  если создаете процессы/потоки в программе, то некоторые детали их работы знать полезно.

Типовые ошибки Python-разработчиков на собеседованиях +22

Отличие процессов от потоков в Linux

Проблемы с Event Loop

GIL защищает, но не вас

Примитивы синхронизации

Retry всему голова

Комментарии (53)

aranax Автор

aranax Автор

aranax Автор

aranax Автор

aranax Автор

aranax Автор

aranax Автор

aranax Автор

aranax Автор