Математико-статистические методы решения технологических задач
Математико-статистические методы, используемые при решении различных задач, связанных с проводкой буровых скважин, выбираются из обширного арсенала широко известных методов, детально разработанных в теории вероятностей и смежных с ней. прикладных дисциплинах. Поэтому в настоящем разделе приводятся без ссылок только некоторые основные соотношения, необходимые для построения системы обработки массивов промысловой информации.
Как было указано выше, применение отдельных статистических методов приводит непосредственно к решению различных частных задач, которые могут быть использованы при совершенствовании практической технологии бурения и которые, в свою очередь, являются необходимыми звеньями решения более общей задачи, например построения режимно-технологической программы проводки скважины. К таким частным задачам относятся нахождение средних значений показателей и параметров бурового процесса с оценкой надежности и точности получаемых результатов и сравнением различных технологических вариантов, дисперсионный анализ показателей бурения, корреляционный анализ влияния различных факторов на показатели и т. п. В связи с этим целесообразно разделить изложение настоящего раздела на отдельные математико-статистические методы.
Определение средних показателей эффективности бурения для групп долот, ^составляющих статистическую совокупность. Сравнение технологических
вариантов
Обработка промысловой информации начинается с выбора массива и формирования статистических групп. Под статистической группой мы будем понимать группу рейсов, относящихся разумеется, в пределах определенных допущений, к одинаковым геологическим и технологическим условиям. Для каждой статистической группы прежде всего произодятся определение средних показателей бурения и оценка их относительной погрешности при заданной доверительной вероятности. Затем, в случае необходимости, сравниваются средние показатели эффективности различных технологических вариантов бурения.
Долота одной и той же модели, отработанные в одинаковых геологических и технологических условиях и, следовательно, принадлежащие к одной статистической группе, показывают различные результаты по проходке и времени механического бурения за рейс. Объясняется это тем, что при проведении испытаний изменяются не только основные факторы, влияние которых изучается, но и ряд дополнительных невоспроизводимых факторов, к которым можно отнести неоднородность пород, колебания режимных параметров, произвольное определение моментов подъема долота, существенное различие в конструктивных параметрах однотипных долот и т. д. Именно благодаря действию этих невоспроизводимых факторов измеряемые показатели оказываются случайными величинами.
Если бы существовала возможность проводить испытания абсолютно идентичных долот в неизменных условиях при абсолютной точности измерения, то результат такого испытания мог бы считаться истинной величиной и можно было бы установить зависимость этой величины от основных факторов, хотя бы по результатам единичных рейсов для каждой группы условий. Наличие же невоспроизводимых факторов и погрешности замеров приводят к существованию генеральной совокупности случайных величин, образованной всем множеством случайных значений, и к возможности получения выборки значений, принадлежащей генеральной совокупности и определенным образом ее характеризующей.
Например, если все возможные значения проходки на долото определенного типоразмера при отработке его в определенных положениях и технологических условиях считать генеральной совокупностью, то получаемая после сортировки промысловой информации статистическая совокупность из значений проходки на это долото, отработанное в данных условиях, образует выборку. По этой выборке будем судить вообще о работе долота данного типа в указанных геолого-технологических условиях.
Так как при анализе промысловой информации, как правило, приходится иметь дело с небольшими объемами информации (от 3—5 до 10—20 рейсов в сходных геологических и технологических условиях), то при обработке данных следует пользоваться статистическими методами, разработанными для малых выборок.
Многочисленными оценками, произведенными для различных геолого-технологических вариантов бурения, а также результатами, полученными другими исследователями, установлено, что распределение случайных величин показателей эффективности бурения подчиняется нормальному закону. Поэтому приводимые ниже оценки даны применительно к нормальному распределению.
Пусть имеем технологические варианты отработки долот определенного типа со следующими показателями: хи х2, …, хп. Прежде всего из данной выборки следует исключить анормальные результаты. Метод оценки анормальности результатов наблюдений для небольших объемов выборок, когда неизвестно генеральное среднее и генеральная дисперсия основана на использовании критерия Стъюдента [27], сводится к определению случайной величины
J "
где x = — V X( — среднее выборки;
I—1
/ ~l I
5—1/ l~l _ среднее квадратическое отклонение выборки;
max — максимальное значение случайной величины х{; Xjmin— минимальное значение случайной величины х{.
В зависимости от доверительной вероятности а и числа степеней свободы f = n—1 по таблице значений wmax((f, а) [27] определяем максимально возможное значение величины w.
Если w>wmax, то хтах или хт1п является анормальным результатом.
Если w<wmax, то xmax или xmin является следствием статистического разброса.
После исключения анормальных результатов следует заново определить среднее значение выборки, по которому можно судить о результатах работы долота. Однако при этом следует учитывать возможную погрешность полученных средних значений показателей бурения.
Для небольших выборок истинное значение а случайной величины с доверительной вероятностью а заключено в пределах
x — ta—r=-<a*cx + ta—^=r-, (7.2)
У п У п
где tа определяется по соответствующей таблице значений taifa) [27].
Отсюда нетрудно получить, что относительная погрешность полученного среднего результата составляет
8= -^100%. (7.3)
Уп X
Приведем пример использования рассмотренной методики. При отработке группы долот были получены следующие результаты определения проходки за рейс Н (в м): 15; 7,8; 15; 48,5: 18,1; 20,3; 20; 20; 20,3; 11; 17,5; 21; 13; 17,5; 20,2; 21,3.
Задавшись доверительной вероятностью а —0,9, проверим, является ли наибольшее значение проходки анормальным. Для этого определяем среднее выборки, среднее квадратическое отклонение и величину w
Н = 19,1, 5 = 9,055, w = 3,247.
По таблице значений wmax(f, а) находим, что при а=0,9 и числе степеней свободы f = n—1 = 14, штах = 2,3. Поскольку
w>wmax, то наибольшее значение выборки //гтах = 48,5 м можно считать анормальным.
Аналогично проверяем на анормальность наименьший результат по проходке на долото. При этом объем выборки уменьшается до величины ri = n—1. Поэтому следует заново подсчитать значения среднего выборки и среднего квадратического отклонения
^=-4—=1.7; ‘Л,-, =4,131;
иг — Нщп = 2 23.
1 ’
При доверительной вероятности 0,9 и числе степеней свободы f — П—1 = 13 находим по таблице значений ^тах = 2,26. Так как ац<штах, то наименьшее значение проходки Hi тт= = 7,8 м и является следствием статистического разброса. В случае надобности операцию исключения анормальных результатов можно повторить, если имеются еще и другие результаты, значительно отличающиеся от средней выборки.
После этого проводим оценку погрешности замены истинного результата средним Н. При той же доверительной вероятности а = 0,9 определяем относительную погрешность по формуле (7.3). Коэффициент ta находим по таблице значений^ (f, а) для а = 0,9 и f = n{—1 = 13. Получаем, что возможная относительная погрешность вычисленного среднего значения проходки Н— 17 м составляет е=12%.
Подобным образом вычисляются средние значения показателей эффективности процесса бурения для всех групп рейсов, выполненных в сходных геолого-технологических условиях и составляющих статистическую совокупность (однородную группу). В результате массив технологической информации может быть рассортирован на однородные группы и появляется возможность составить сводные таблицы средних показателей, обеспечивающие достаточно надежную отчетность и дающие возможность провести общую оценку состояния буровых работ по блоку, площади и в целом по месторождению.
Весьма важной является задача сравнения различных технологических вариантов, в частности, сравнения эффективности работы долот разных типов и различных режимов бурения. Это необходимо не только для составления режимно-технологической программы проводки скважин, но и для других целей, например для оценки работы экспериментальных конструкций долот.
Пусть необходимо сравнить по некоторому показателю эффективности х два различных технологических варианта бурения для сходных геологических условий. Для каждого варианта подсчитаны средние дисперсии выборки:
х\ Sf, ri — для первой совокупности;
х2; S%; п2 — для второй совокупности.
При заданной доверительной вероятности а следует оценить, является ли расхождение между средними значениями показателей х и х2 случайным или значимым, т. е. установить, принадлежат ли обе выборки одной генеральной совокупности.
Прежде всего по критерию Фишера сравниваем дисперсии выборок. Для этого определяем отношение F большей дисперсии к меньшей
F = SbSl (7.4)
Задавшись доверительной вероятностью а и определив число степеней свободы f — ri—1 и f2 = n2—1, можно найти значение критерия Фишера FT по таблице FT( a, f, f2) [27]. Если
F^FT, то различие между дисперсиями статистически незначимо и сравнение средних двух выборок производится следующим образом.
Определяем средневзвешенную дисперсию
(га, — 1) S? + (га, — 1) si S2 = — —1—— — (7.5)
■ га1 + га, — 2
и среднее квадратическое отклонение 5.
Из таблицы значений ta (f, а) находим коэффициент ta, соответствующий доверительной вероятности а и числу степеней свободы /—fi+b — ti—ti2—2. Затем проверяем неравенство
>taS / — + —. (7.6)
Если неравенство выполнено, то различие между средними существенно. В противном случае различие между ними случайно и выборки принадлежат одной генеральной совокупности.
Если F>FT, то различие между дисперсиями и S| не случайно и сравнивать средние следует по приближенному критерию
т = (М + w-ltg (/?) (7 7)
Y WL + w2
где wx = Slnx’, w, = Syn2.
Если выполняется неравенство х—х2~^Т, то различие между средними рассматриваемых совокупностей не случайно. В противоположном случае можно принять, что эти средние идентичны.
Рассмотрим в качестве примера сравнение показателей работы долот В-190Т и В-190К при турбинном бурении в сходных геолого-технологических условиях (нагрузка 20 тс, давле — иие 120 кгс/см2, расход промывочной жидкости 25 л/с). Полученные результаты по проходке на долото представлены в табл. 18.
Таблица 18
= 23,0 м #2 = 22,2 м =57,47 Si =69,84 пг = 10 п2 = 7 |
Проведем сравнение дисперсий по критерию Фишера F= = 1,22</7 = 3,37. Дисперсия 52=62,42 и 5 = 7,9.
При числе степеней свободы f=/14-f2= 15 и а=0,9 найдем
/сс = 1,753. Величина taS / _L _j_ JL — 6,82, в то время как
V «1 «2
| 1=0,8.
Следовательно, с доверительной вероятностью а = 0,9 статистическое различие между средними проходками долот В-190Т и В-190К не установлено.
Дисперсионный анализ показателей процесса бурения
При решении некоторых задач возникает необходимость сравнения показателей бурения для целого ряда технологических вариантов с целью либо выбрать из них оптимальный, либо определенным образом сгруппировать влияющие факторы. В практике бурения чаще всего приходится пользоваться однофакторным дисперсионным анализом, так как подобрать информацию по одновременному влиянию двух или нескольких факторов, независимо изменяющихся в сходных геологических условиях, бывает затруднительно. Обычно такие материалы получают при проведении специальных промысловых экспериментов, в которых можно независимо и в достаточно широком диапазоне изменять, например, нагрузку на долото, скорость его вращения и давление промывочной жидкости.
Покажем метод использования однофакторного дисперсионного анализа [32] на примере рационального разделения на интервалы диапазона варьирования влияющих факторов при формировании массива промысловой технологической информации.
В случае чересчур детального разделения диапазона варьирования факторов статистические группы сходных геолого-тех — нологических условий могут оказаться непредставительными, т. е. содержать малое количество рейсов. В связи с этим встает задача о расширении этих групп за счет объединения соседних интервалов.
Может оказаться, что различие между значениями показателей бурения, соответствующих различным интервалам, незначимо, что и будет свидетельствовать об излишне мелкой произвольной разбивке диапазона изменения данного фактора.
Интервалы следует объединять исходя из условия, чтобы изменение рассматриваемого ■ фактора внутри каждого укрупненного интервала не оказывало значимого влияния на показатели бурового процесса. Вся совокупность значений показателя Х{, соответствующая обработке N долот, априорно разделена на q групп, причем в каждой группе представлено щ рейсов, так что l^/sSiyV и В каждой /-й группе, соответствующей
данному интервалу изменения исследуемого фактора, опреде-
1 1 =ni
лим среднегрупповое значение показателя У]л’,.
л/ i=i
Для проверки значимости различия между среднегрупповыми значениями показателя эффективности бурения для двух соседних интервалов k и I изменения влияющего фактора вычисляется критерий
TOC o "1-5" h z 0 = nkni fa — *г)2 (j щ
Пк +ГЦ ст2 ’
где
2Х-23»/ ■
а2=_Ы——— /=!—— .
N — q
Вычисленный критерий 0 сравнивается с его значением, взятым из таблиц 0(а, ffa), причем fi = l, a f2 = N—q.
Такая проверка осуществляется для всех попарных сочетаний среднегрупповых значений показателя, после чего те группы, для которых средние различаются незначимо, объединяются.
Рассмотрим для примера промысловые данные о скоростях бурения в 450 рейсах. В качестве влияющего фактора примем давление промывочной жидкости р (в кгс/см2). Диапазон изменения давления составляет 50—190 кгс/см2. Первоначально он был разбит на 14 интервалов по 10 кгс/см2 в каждом (см. табл. 20).
Для проверки возможности объединения групп следует рассортировать имеющиеся данные по группам, определить их среднегрупповые значения и затем использовать для каждой пары соседних групп соотношение (7.8).
Проведенный дисперсионный анализ показал, что некоторые средние vj различаются между собой незначимо и, следовательно, соответствующие группы представляют собой одну статистическую совокупность и могут быть объединены. После попарного сравнения всех групповых средних была произведена новая разбивка всего диапазона изменения давления на интервалы следующим образом: от 50 до 60 кгс/см2; от 61 до
70 кгс/см2; от 71 до 90 кгс/см2; от 91 до 110 кгс/см2; от 111 до 130 кгс/см2; от 131 до 140 кгс/см2; от 141 до 190 кгс/см2.
Таким образом, количество интервалов сократилось вдвое и, следовательно, большинство статистических групп увеличили свой состав.
Повторная проверка значимости различия между вновь сформированными группами показала, что могут быть объединены следующие интервалы: от 71 до 90 кгс/см2 с интервалом от 91 до 110 кгс/см2, интервал от 111 до 130 кгс/см2 с интервалом от 131 до 140 кгс/см2.
Таким образом, количество интервалов сокращается до пяти.
Произведенная еще раз проверка значимости различия между группами не выявила возможности дальнейшего укрупнения интервалов (табл. 19).
Таблица 19
|
В качестве примера еще более эффективного укрупнения интервалов варьируемого фактора можно привести данные по влиянию на скорость проходки осевой нагрузки на долота. Диапазон изменения этого фактора от 5 до 21 тс был предварительно разбит на 17 интервалов через 1 тс. В результате сравнения групповых средних Vj, соответствующих каждому из первоначальных интервалов, всю область изменения нагрузки удалось разбить всего лишь на 3 интервала: от 5 до 12 от 13 до. 17, от 18 до 21 тс (табл. 20).
Таблица 20
Осевая |
Ср еднегру ппова я |
Количество |
Среднегрупповая |
Количество |
нагрузка, |
скорость проходки, |
рейсов |
скорость проходки, |
рейсов |
тс |
м/ч |
в группе |
м/ч |
в группе |
5 |
7,57 |
3 |
8,23 |
158 |
6 |
10,10 |
6 |
||
7 |
7,90 |
и |
||
8 |
11,88 |
10 |
||
9 |
10,87 |
9 |
||
10 |
7,89 |
31 |
||
11 |
8,01 |
31 |
||
12 |
7,10 |
57 |
||
13 |
11,69 |
60 |
10,37 |
259 |
14 |
10,10 |
48 |
||
15 |
9,66 |
53 |
||
16 |
10,53 |
55 |
||
17 |
9,52 |
42 |
||
18 |
14,93 |
10 |
13,41 |
28 |
19 |
11,26 |
8 |
||
20 |
11,32 |
7 |
||
21 |
13,39 |
3 |
В этом случае почти в 6 раз сократилось число интервалов: и соответственно во много раз увеличилась численность каждой статистической группы. Повторная проверка показала, что* новые группы отличаются значимо и, следовательно, не могут быть объединены.
Корреляционный анализ влияния факторов, определяющих процесс бурения,,
на его показатели
Аппарат множественного корреляционного анализа при решении конкретных практических и исследовательских задач [18, 21] может быть использован для ранжирования влияющих факторов и выделения группы факторов, имеющих значущую* взаимосвязь с показателями процесса бурения. Необходимость ранжирования проявляется чаще всего в тех случаях, когда по условиям поставленной задачи требуется среди значимых факторов выделить один или несколько основных, оказывающих на процесс бурения наибольшее влияние. Весьма важно также бывает установить значимость взаимодействия факторов, определить возможность закрепления ряда факторов на определенных, уровнях при изучении влияния одного из них на исследуемый показатель (результативный признак).
При использовании корреляционного анализа в указанных целях необходимо прежде всего разделить весь диапазон варьирования каждого фактора и показателя на некоторое количество интервалов, определяемое согласно соотношению
£ = [1 + 3,321gn], (7.9)
где k округляется до ближайшего целого числа; п — общее количество экспериментальных результатов, подвергаемых обработке, например количество исследуемых рейсов.
Размеры каждого интервала для фактора или показателя х при равномерной разбивке, естественно, определяются, как
Aje = *max —*mln _ (yjQ)
В соответствии с такой разбивкой следует составить корреляционную матрицу. Для парной корреляции величин хну
такая матрица представлена в табл. 21. Заметим, что анализ кор-
Таблица 21
|
реляционных связей проводится совершенно одинаково между результативным признаком и влияющим фактором или между двумя признаками или факторами.
Значения х,- и у:, соответствуют серединам интервалов. Вычислив средние значения факторов на всей совокупности |
X xi4i 1=1 |
J] ytPi i= i |
(7.11) |
и соответствующие дисперсии |
X((// /=1 |
w — х) qt |
■ у) Р/ |
1=1 |
(7.12) |
я — 1 |
я — 1 |
введем новые переменные, связанные с факторами х* и tjj следующими соотношениями: |
Х; — Х |
У,- —У |
(7.13) |
Jy |
Тогда коэффициент корреляции определяется, |
как |
j РЧ rxy — ~ X |
(7.14) |
причем частоты берутся из табл. 21. При оценке значимости вычисленного коэффициента парной корреляции проверяют гипотезу гху = 0, что соответствует случаю независимости факторов х и у. Для этой проверки вычисляют критерий |
(и — 2) г |
ху |
(7.15) |
t = |
1 |
ху |
который соответствует распределению Стьюдента с числом степеней свободы f = n—2. Как обычно, если критерий t больше соответствующего табличного значения, то случайные величины Xj и tjj считаются независимыми. Расчеты, подобные изложенному выше, проводятся для всех комбинационных пар влияющих факторов и показателей бурения, участвующих в решении конкретной задачи., В результате можно составить симметричную матрицу |
/1 Н-2 Из • |
. . rSl |
|
1 г.,л. |
. rS |
|
С = |
1 . |
. rS |
…………….. |
.1 |
(7.16) |
где 5 — общее количество рассматриваемых факторов и показателей. |
Если требуется исследовать корреляцию между переменными с условными номерами 1 и 2 при нейтрализации, т. е. при закреплении на средних уровнях остальных переменных 3, 4…5, то соответствующий коэффициент корреляции вычисляется в виде
5 = (7Л7)
Cji — детерминант, образуемый как алгебраическое дополнение для коэффициента Гц в матрице (7.16).
В частности, для S = 3 и 5 = 4
/*19 — Л a/*23
Т 12.34 =
а12.4 — Г13.4Л23.4 ^ 12.34 ’-= •
У’ (1 — 4.4) С1 —■ 4.4)
Для проверки значимости коэффициентов корреляции типа (7.17) пользуются критерием (7.15), принимая число степеней свободы f = n—p + q—2.
Для решения множественной корреляции составляют систему уравнений
} 12 = Р2 — р Р3Г32 Р4Т42 “Ь. . . — р PsT. S,
Г13 “Г Р’2Г23 “Г Р. З ~ РЛз + ■ • ■ ~1" PsrS> ^ j
Г IS — р2Г25 + РзГ35 + Pir45 + • ■ • Ps-
Найденные отсюда значения (Зь |32, •••, Р« позволяют вычислить коэффициент множественной корреляции показателя под номером 1 относительно всех действующих факторов
0.23 . . . s = У^РгПг + Рзг1з + ■ • • + PsOs • (7.20)
В случае необходимости знание коэффициентов корреляции позволяет получить в качестве первого приближения линейные •уравнения регрессии в условных переменных (7.13): для парной корреляции
ti = rxyti. (7.21)
для множественной корреляции
А.23 . . .s = Рг^2 Рз^з + • • • ~Е Ps£s* (7.22)
Рассмотрим в качестве примера использование метода корреляционного анализа для изучения влияния ряда факторов на скорость проходки V. В качестве этих влияющих факторов
выбраны нагрузка на долото G, глубина скважины L и давле
ние на насосах р.
V, м/ч |
|||||||||||
L, м |
СО |
О |
X |
см |
о |
||||||
1 со |
X) | |
7 |
7 |
i |
i |
I |
7 X |
1 |
т X |
||
О |
х |
— |
— |
СЧ |
СЧ |
СО |
со |
н- |
|||
0—180 |
1 |
1 |
2 |
3 |
2 |
I |
1 |
11 |
|||
180—360 |
— |
— |
3 |
3 |
1 |
2 |
1 |
2 |
1 |
1 |
14 |
360—540 |
— |
— |
4 |
5 |
6 |
3 |
2 |
— |
— |
1 |
21 |
540—720 |
1 |
2 |
4 |
7 |
5 |
2 |
2 |
— |
1 |
— |
24 |
720—900 |
1 |
— |
11 |
5 |
7 |
3 |
4 |
I |
— |
— |
32 |
900—1080 |
1 |
6 |
12 |
15 |
4 |
6 |
2 |
1 |
— |
2 |
49 |
1080—1260 |
18 |
13 |
36 |
8 |
1 |
1 |
— |
— |
—. |
—. |
77 |
1260—1440 |
27 |
39 |
27 |
2 |
95 |
||||||
1440—1620 |
18 |
43 |
15 |
2 |
_ |
1 |
_ |
— |
— |
— |
79 |
1620—1800 |
20 |
25 |
4 |
— |
_ |
_ |
_ |
_ |
— |
—. |
49 |
Srtiy /’ |
87 |
128 |
117 |
49 |
27 |
20 |
11 |
5 |
3 |
4 |
451 |
Общее количество рейсов, выполненных в разных условиях, составляет л = 451. В соответствии с табл. 22 диапазоны варьирования переменных делятся на 10 интервалов каждый.
Аналогичные таблицы были построены и для следующих пар: v—р v—G, а также для факторных пар с целью установить наличие взаимосвязи между ними: L—р L—G; р—G.
Вычисленные коэффициенты парной корреляции оказались ■следующими
rv, L=— 0,62; r„>G = 0,10; rVtP=— 0,33; rPiL = 0,57; rp, G = 0,14; •TG, L = 0,1 1.
При проверке коэффициенты корреляции rViG и rGiL оказались незначимыми (а = 0,98). В отношении связи между нагрузкой и скоростью бурения полученный результат представляется на первый взгляд странным. Однако суть дела заключается в том, что собраны рейсы, соответствующие большому диапазону глубин скважин, которые и являются главной причиной изменения скоростей проходки. Диапазон же варьирования осевых нагрузок в данном случае невелик.
В самом деле, между скоростью проходки и глубиной скважины выявлена значительная отрицательная корреляция. Если же нейтрализовать влияние увеличивающегося с глубиной давления (rv, L = 0,57), то соответствующий коэффициент частной корреляции оказывается равным rViL, p,——0,77, т. е. наблюдается еще более тесная отрицательная связь.
Нелогичным представляется значимый парный коэффициент корреляции гь% р =—0,33, свидетельствующий об уменьшении скорости проходки при росте давления на насосах. И в этом случае глубина скважины оказывает косвенное влияние: дав-
ление растет тогда, когда увеличивается глубина, что в свок> очередь приводит к падению скорости.
Действительно, частный коэффициент кореляции rVtPti = = 0,04. Иными словами, при нейтрализации фактора глубины взаимосвязь давления и скорости бурения в данном случае устраняется.