LINEBURG


<< Пред. стр.

страница 8
(всего 11)

ОГЛАВЛЕНИЕ

След. стр. >>

i
iv , y = x
(7) vil(x, y) = i il i i , i I N, l I M,
i0, yi ? xi
is j , y = x
, j I K,
(8) sj(x, y) = i
0, y ? x
i
iq , y = x
, l I M.
(9) ql(x, y) = i l
0, y ? x
i
В соответствии с (5)-(9) ненулевые выплаты имеют место только в том
случае, когда все участники стимулируют друг друга за выполнение одних и
тех же планов, причем агенты выполняют планы. Отметим, что из (5) и (7) сле-
дует, что i-ый агент получает ненулевое вознаграждение (компенсацию затрат
при любой обстановке игры) только в случае выполнения им соответствующей
компоненты плана, независимо от того, выполнили ли планы остальные агенты.
Соответствующий принцип управления был предложен в [100] и получил на-
звание принципа децентрализации игры агентов. Для сравнения отметим, что из
(6), (8) и (9) следует, что вознаграждения ФР и РП отличны от нуля только в
том случае, если все агенты выполнили планы.
Исследуем теперь вопрос о том, в каких случаях агентам будет выгодно
выполнять планы и какие при этом должны быть равновесные системы стиму-
лирования (5)-(9). Соответствующее управление назовем согласованным.
Задача поиска множества согласованных управлений заключается в фор-
мулировке условий того, что выбор соответствующих стратегий будет равнове-
сием игры участников организационной системы на каждом из уровней иерар-
хии. Другими словами, для каких планов найдется совокупность
вознаграждений за выполнение этих планов (см. (5)-(9)), таких, чтобы агенты
выполняли планы как равновесие Нэша своей игры, а выбор именно данных
функций стимулирования был бы равновесием Нэша игры РП на своем уровне
иерархии и ФР – на своем уровне. Имея решение этой задачи, в следующем
53
разделе формулируется и решается задача синтеза оптимальных (с точки зрения
ВР) согласованных управлений.
Исследуем сначала игру агентов.
Лемма 1. Если при использовании системы стимулирования агентов (5), (7)
выполнено
(10) as ij + a vil ? ci(x), i I N,
jIK l IM

то выбор действия yi = xi является доминантной стратегией i-го агента, i I N.
Справедливость утверждения леммы 1 следует из подстановки (5), (7) и
(10) в определение доминантной стратегии [43].
Вычислим следующие величины:
wj = max [hj(y) – a ci ( y ) ], j I N,
yI A'
iIN

a c ( y ) ], l I M.
Wl = max [Hl(y) – i
yI A'
iIN

a c ( y ) ].
W0 = max [H0(y) – i
yI A'
iIN

Утверждение 1. При плане x I A' множества Парето-эффективных равно-
весий Нэша игры руководителей проектов и Парето-эффективных равновесий
Нэша игры функциональных руководителей не пусты тогда и только тогда,
когда выполнено (10) и
(11) hj(x) + a u jl + sj – a s ij ? wj, j I K.
l IM iIN

au av ? Wl, l I M.
(12) Hl(x) + ql – –
jl il
jIK iIN

aq as ? W0.
(13) H0(x) – –
l j
l IM jIK

Утверждение 1 доказывается по аналогии с соответствующими утвержде-
ниями в [58, 101].
Назовем план x I A' согласованным, если существует такой набор систем
стимулирования, которые являются Парето-эффективными равновесиями игр
ФР и РП, и при которых агенты выполняют план как равновесие своей игры.
Также предположим, что в случае, когда множества равновесий игр ФР или РП
состоят более чем из одной точки, ВР может выбирать любое конкретное рав-
новесие из соответствующих множеств.
Лемма 1 и утверждение 1 обосновывают справедливость следующего ут-
верждения.
Утверждение 2. Для того чтобы план x I A' был согласованным достаточно
выполнения условий (10)-(13).
Утверждение 2 гласит, что заданный план будет согласованным, если для
него найдется набор из [(n + 1) (k + m) + k m] вознаграждений:
(14) {sij}i I N, j I K, {vil}i I N, l I M, {ujl}j I K, l I M, {ql}l I M, {sj}j I K,
такой, что константы (14) удовлетворяют системе неравенств (10)-(13).
Рассмотрим следующую задачу. Фиксируем план x I A' и найдем
[ a s j + a ql ].
(15) C(x) = min
{( s , q ) | (10 ) - (13)}
jIK l IM


54
Величина (15) характеризует минимальные затраты высшего руководства
по реализации согласованного плана x I A'. Для тех планов, для которых сис-
тема неравенств (10)-(15) не имеет решения, положим затраты (15) равными
плюс бесконечности.
С учетом (15) целевая функция (4) ВР примет вид:
(16) F0(x) = H0(x) – C(x).
Оптимальным согласованным планом будет
(17) x* = arg max [H0(x) – C(x)].
xI A '

По аналогии с результатами, приведенными в [34, 91], можно показать, что
условием существования согласованного плана является следующее неравенст-
во: max [H0(x) + a H l ( x ) + a h j ( x ) – a ci ( x ) ] ? W0 + aWl + a w j .
xI A '
l IM jIK iIN l IM jIK

Таким образом, решение задачи согласованного управления научными
проектами в рамках рассматриваемой модели состоит из двух этапов: на первом
этапе для каждого плана x I A' проверить возможность его согласования (суще-
ствования величин (13), удовлетворяющих (10)-(12)) и найти затраты (14) ВР;
на втором этапе найти оптимальный согласованный план (16).
Задача, решаемая на первом этапе, хотя и является задачей линейного про-
граммирования, выглядит достаточно громоздко, тем более что решать такие
задачи нужно для каждого плана x I A'. Поэтому особенно привлекательно
выглядит демонстрируемая ниже возможность нахождения аналитических ре-
шений.
Из (10)-(13) получаем, что для значения (15) справедлива следующая оцен-
ка: " x I A'
(18) C(x) ? aWl + a w j – a H l ( x ) – a h j ( x ) + a ci ( x ) .
l IM jIK l IM jIK iIN

Таким образом, обоснована справедливость следующего утверждения:
Утверждение 3. Для максимального выигрыша ВР справедлива следующая
оценка:
(19) F * ? H0(x**) – C(x**)
0

где
(20) x** = arg max [H0(x) + a H l ( x ) + a h j ( x ) – a ci ( x ) ].
xI A '
l IM jIK iIN

Интересно отметить, что согласованный план (20) максимизирует сумму
целевых функций всех участников системы – ВР, ФР, РП и исполнителей, то
есть является Парето-оптимальным с точки зрения системы в целом.


2.3. Распределение ресурсов в научных проектах

Одним из характерных отличий научных проектов является то, что в них
руководители проектов, как правило, подчинены руководителям подразделений
(функциональным руководителям). Поэтому перед функциональным руководи-
телем, помимо задачи обеспечения регулярной деятельности (например, заве-
55
дующий кафедрой в ВУЗе должен обеспечить нормальный ход учебного про-
цесса), стоит задача распределения его подчиненных (например, профессорско-
преподавательского состава кафедры) между научными проектами. Условно
эту задачу можно назвать задачей о планировании нагрузки. Приведем ее фор-
мальную постановку и обсудим возможные способы решения.
Обозначим tij – время, затрачиваемое i-ым агентом на работу по j-му про-
екту, ti0 – время, затрачиваемое им на регулярную деятельность, где
i I N = {1, 2, …, n} – множеству агентов, j I M = {1, 2, …, m} – множеству про-
ектов. Пусть заданы: Tj – оценка суммарных трудозатрат по j-му проекту; T0 –
суммарная нагрузка по регулярной деятельности (например, учебная нагрузка
кафедры); Ti max – максимальное рабочее время i-го агента, i I N; aij –
эффективность участия i-го агента в j-ом проекте, i I N, j I M E {0}; bj – при-
оритетность j-го проекта с точки зрения функционального руководителя, j I M.
В качестве критерия эффективности выберем суммарную эффективность
реализации проектов исполнителями, подчиненными данному функционально-
му руководителю:
(1) a b j a aij tij + a ai 0ti 0 ® max .
{t ij }
jIM iIN iIN

Отметим, что данный критерий отражает «локальные» приоритеты кон-
кретного функционального руководителя, которые могут не быть согласован-
ными с представлениями высшего руководства, отвечающего за реализацию
комплекса научных проектов в организации в целом.
Для согласования интересов различных участников существуют специаль-
ные механизмы, рассматриваемые в [97].
Рассмотрим теперь ограничения, которым должно удовлетворять распре-
деление нагрузки. Во-первых, необходимо выполнить суммарную нагрузку:
(2) a ti 0 = T0.
iIN

Во вторых, необходимо удовлетворить ограничениям на объемы работ по
научным проектам:
(3) a tij = Tj, j I M.
iIN

И, наконец, в третьих, следует учесть ограниченность рабочего времени
каждого агента:
(4) a tij ? Ti max , i I N.
jIM

Задачу максимизации (1) с ограничениями (2)-(4) назовем задачей о рас-
пределении нагрузки. Это – задача линейного программирования с (m + 1) n
неизвестными и n + m + 1 ограничением. Более того, задача (1)-(4) является
классической транспортной задачей [18], решение которой существует, если
выполнено следующее условие:
(5) a Ti max ? T0 + a T j .
iIN jIM




56
Его содержательная интерпретация: сумма ограничений на рабочее время
всех агентов не меньше суммарной нагрузки (по регулярной деятельности и
всем проектам).
Отметим, что, в соответствии с ограничением (3), функциональный руко-
водитель не допускал невыполнения какого-либо из проектов. Это ограничение
можно ослабить, сформулировав задачу одновременного определения множе-
ства выгодных проектов (это множество может оказаться строго уже, чем мно-
жество M, даже если все проекты имеют высокий приоритет, но нарушено ус-
ловие (5)) и распределения агентов между ними. Для этого достаточно в (3)
вести суммирование по множеству реализуемых проектов, которое, в свою оче-
редь, также требуется найти. Получили «гибрид» транспортной задачи и задачи
о ранце [18], в котором уже присутствует дискретная компонента. Для решения
сформулированной задачи требуется для каждого подмножества множества
проектов решить задачу (1)-(4), после чего получится классическая задача о
ранце.
Выше сформулирована и решена (сведена к известным) задача функцио-
нального руководителя, заключающаяся в распределении нагрузки (по регу-
лярной деятельности и проектам) между агентами. При этом предполагалось,
что эффективности деятельности агентов достоверно известны. На практике это
не всегда так, поэтому рассмотрим задачу принятия решений руководителем
проекта в условиях неполной его информированности об эффективности дея-
тельности участников проекта.
Предположим, что руководителю проекта необходимо распределить объем
R работ между n агентами, эффективности {ri} ему неизвестны. Из теории при-
нятия решений известны несколько способов устранения неопределенности
[21]. Наиболее распространены два из них – принцип максимального гаранти-
рованного результата, дающий пессимистическую оценку, и механизм с сооб-
щением информации, в котором управляющий орган принимает решения на
основании информации, сообщенной агентами (например, агенты сообщают
оценки эффективности своей деятельности).
Известно, что при использовании механизмов с сообщением информации
возникает проблема манипулирования – агентам может быть невыгодно сооб-
щение достоверной информации [21]. В рассматриваемой модели систем
управления научными проектами эффект манипулирования информацией мо-
жет заключаться в следующем. Если предположить, что для любого агента бо-
лее предпочтительно участие в научном проекте, нежели чем аудиторная на-
грузка (а это предположение, как свидетельствует опыт, достаточно
реалистично), то агенты будут стремиться завысить сообщаемые оценки эф-
фективности своей деятельности в рамках научных проектов.
Однако, во-первых, научные проекты, реализуемые подразделением, как
правило, взаимосвязаны (и по содержанию, и по результатам) между собой и
тесно связаны с содержанием учебного процесса. Поэтому при постановке и
решении задачи планирования (распределения работ) необходимо учитывать
эту взаимосвязь.

57
Отметим, что в большинстве известных механизмов планирования пред-
почтения агентов сепарабельны, то есть выигрыш каждого агента зависит толь-
ко от плана, назначенного именно ему, и не зависит от планов, назначенных
другим агентам [110]. Исключением являются так называемые механизмы со-
гласия, в которых каждый агент заинтересован в своей компоненте плана и еще
одной – общей для всех – компоненте, называемой базовой. В механизмах со-
гласия удается добиться достоверности сообщаемой агентами информации [21],
поэтому их использование в задачах распределения работ по научным проектам
целесообразно (в качестве базовой компоненты можно выбрать, например, ре-
гулярную деятельность). Однако при этом различные проекты (кроме попарно –
каждый с базовой компонентой) будут несвязанны.
Для отражения заинтересованности агентов в реализации всех проектов
предположим, что их предпочтения описываются следующими функциями
полезности
(6) fi(x(s)) = – a g ij ( x j ( s ) - xij )2 , i I N,
jIN

где xj(s) – j-ая компонента вектора x(s) = (x1(s), x2(s), …, xn(s)) планов, зависяще-
го от вектора s = (s1, s2, …, sn) сообщений агентов; gij ? 0 – константы; xij – пред-
ставления i-го агента о том, какой план следует назначить j-му агенту, i, j I N.
Частным случаем (6) являются сепарабельные однопиковые предпочтения
(gij = 0, j ? i), рассматриваемые в [21, 110].
Предположим, что используется следующая процедура планирования
(принцип пропорционального распределения [21]):
si
R , i I N.
(7) xi(s) =
asj
j IN

Исследуем равновесные сообщения агентов в зависимости от их взаимных
представлений {xij}. Для того, чтобы получить аналитические результаты,
возьмем случай двух агентов с g11 = g 22 = 1, g12 = x1, g21 = x2 si I [0; 1],
xij I [0; 1], i, j = 1, 2, R = 1. Содержательно константа xi означает насколько i-ый
агент заинтересован в назначении выгодного плана агенту 3 – i, по сравнению с
заинтересованностью в получении выгодного плана для себя (понятно, что при
сепарабельных предпочтениях xi = 0), i = 1, 2.
Утверждение 4. Для того чтобы сообщения агентов, образующие стабиль-
ное информационное равновесие, были пропорциональны друг другу и сущест-
вовали, достаточно выполнения следующего равенства:
(8) x11 (1 + x2) + x22 (1 + x2) + x1 x2 = x12 x1 ( 1 + x2) + x21 x2 (1 + x1) + 1
Справедливость утверждения 4 следует из непосредственного нахождения
информационного равновесия и проверки условий его стабильности [102].
В предельных случаях получаем:
– при сепарабельных предпочтениях стабильное информационное равнове-
сие существует при x11 + x22 = 1;
– при одинаковой взаимной заинтересованности агентов (то есть при
x1 = x2 = 1) стабильное информационное равновесие существует при
x11 + x22 = x12 + x22.
58
Содержательная интерпретация последнего условия такова: сумма пред-
ставлений агентов о том, каковы планы, оптимальные для каждого из них,
должна совпадать с суммой их представлений о том, каковы планы, оптималь-
ные для оппонента.


2.4. Стимулирование исполнителей научных проектов

Различные виды взаимодействия между субъектами социально-
экономических систем можно рассматривать как обмен между ними, принося-
щий выигрыш каждой из обменивающихся сторон. Взаимодействие между
руководством кафедры ВУЗа (далее – кафедра) и профессорско-
преподавательским составом (ППС) кафедры не является исключением. В част-
ности, процесс распределения нагрузки на учебную и научную деятельность
можно трактовать как обмен в следующем виде: кафедра раздает имеющийся у
нее в наличии ресурс (время на различные виды деятельности) и взамен полу-
чает результат деятельности ППС. Этот подход позволяет построить математи-
ческую модель кафедры как обменной схемы [67], и применить результаты
теории управления организационными системами [21, 43, 91, 94] и теории ак-
тивных систем (ТАС) [67, 96], полученные при решении различных задач об-
мена, в частности, задач стимулирования [94].
Сформулируем теоретико-игровую модель кафедры, с помощью которой
можно решить задачу повышения результативности научной деятельности (НД)
кафедры. За основу берется модель обмена в двухуровневой активной системе с
конечным числом агентов на нижнем уровне и одним управляющим органом –
центром – на верхнем уровне [96] – см. рисунок 2.8.


Ц


yn
?1

?n
y1

А1 Аn
...


Рис. 2.8. Двухуровневая активная система

Будет моделироваться исключительно процесс распределения нагрузки на
НД. За рамками модели остается вопрос финансовой оплаты труда ППС и пола-

59
гается лишь, что в схеме оплаты труда ППС не учитывается, как именно рас-
пределяется нагрузка.
В модели используются следующие допущения:
1. Нагрузка преподавателя делится на два вида деятельности – учебную и
научную.
2. Рассматривается только один, абстрактный, вид научной деятельности.
3. Эффективность учебной деятельности всех преподавателей одинаковая.
Данные допущения необходимы исключительно для наглядности рассмат-
риваемой модели. Полученные результаты справедливы и при отказе от этих
допущений, однако задача повышения результативности НД будет гораздо
сложнее с математической точки зрения. Кафедру можно рассматривать как
двухуровневую организационную систему, на верхнем уровне которой нахо-
дится руководство кафедры (центр), а на нижнем – ППС кафедры (агенты) (см.
рисунок 2.8).
В системе происходит обмен между центром и агентами. Руководство ка-
федры (центр) выдает ППС кафедры (агентам) время, получая взамен от ППС
результаты НД. Процесс взаимодействия между руководством кафедры и ППС
кафедры можно представить в виде обмена, а саму систему – как обменную
схему [67].
В терминах задачи стимулирования, являющейся частным случаем задачи
обмена [67] взаимодействие между участниками системы имеет следующее
содержание: центр стимулирует временем агентов за выполняемые ими дейст-
вия (получаемые научные результаты). Однако в традиционной постановке
задачи стимулирования агенты получают вознаграждение от центра после вы-
полнения своих действий, а в рассматриваемой модели, центр сначала распре-
деляет время между ППС, а затем преподаватели выбирают свои действия.
Поэтому возможно оппортунистическое поведение [94] со стороны ППС
при котором выданное им время они могут использовать не по назначению.
Численность ППС обозначим n, состав кафедры – N = {1, 2, …, n}. Резуль-
тат НД каждого преподавателя i обозначим за yi, и будем трактовать как коли-
чество авторских листов. В соответствии с терминологией теории активных
систем, yi – действие, выбираемое i-м агентом (преподавателем).
Задача центра будет заключаться в перераспределении нагрузки на НД с
целью максимизации общего результата НД кафедры. Поэтому целевую функ-
цию центра можно записать в виде суммы результатов НД ППС кафедры:
(1) Ф= a yi .
iIN
Руководство кафедры осуществляет распределение нагрузки на НД путем
определения плана НД для каждого преподавателя, который включает: время ti
на осуществление НД преподавателем и результат НД деятельности yi, ожидае-
мый от преподавателя.
На возможности руководства кафедры по перераспределению нагрузки на
НД накладываются следующие ограничения:
1. Суммарное время, выделяемое преподавателям на осуществление НД
должно оставаться неизменным:
60
(2) a t i = a Ti ,

<< Пред. стр.

страница 8
(всего 11)

ОГЛАВЛЕНИЕ

След. стр. >>

Copyright © Design by: Sunlight webdesign