ORIGINAL PAPER
Divergence among estimators of the population mean under right-skewed distributions and outliers – a case study of metal accumulation in Cu-Ag deposits of the LGCD
More details
Hide details
1
AGH University of Science and Techology
Submission date: 2026-02-16
Final revision date: 2026-06-04
Acceptance date: 2026-06-08
Publication date: 2026-06-22
Gospodarka Surowcami Mineralnymi – Mineral Resources Management 2026;42(2):201-219
KEYWORDS
TOPICS
ABSTRACT
The accumulation of metals in the sediment‑hosted Cu-Ag deposits in the Lubin–Głogów Copper District (LGCD, SW Poland) are typically characterized by strongly right‑skewed empirical distributions containing numerous outliers. This study quantifies the divergence among estimates of the population mean of metal accumulation obtained using five commonly used measures of central tendency, treated here as alternative estimators for the target mean relevant to additive resource estimation, under conditions of strong skewness and the presence of outliers.
Large empirical datasets of Cu, Co, Ni, and Pb accumulation values, obtained from ore-deposit sampling in the Rudna mine workings, were treated as reference populations, with their arithmetic means adopted as reference approximations of the population mean relevant to additive resource estimation. Monte Carlo simulations were used to generate 1,000 independent random samples of sizes from empirical distributions: n = 10, 20, 50, 100 and 200.
Two evaluation criteria were applied:
the frequency with which a given estimator produced values closest to the reference population mean,
the mean relative deviation of the estimator from the reference population mean.
The results show that the arithmetic mean yields estimates with negligible bias (from −0.1% to +0.4%), whereas average relative underestimation of the reference population mean by the geometric mean reaches −16.6% for Cu, −29.4% for Co, −18.3% for Ni and −66.7% for Pb.
Within the adopted inferential framework, in which the target parameter is the population mean relevant to additive resource estimation and is approximated by the arithmetic mean of the reference population, the arithmetic mean most frequently yielded estimates closest to this reference value. Its advantage increased with sample size. The Winsorized and trimmed means showed intermediate performance, whereas the median and geometric mean tended to underestimate the reference population mean, particularly under strong skewness and in the presence of numerous outliers.
This conclusion applies specifically within the framework of additive resource estimation and does not necessarily extend to other descriptive uses of central tendency measures. Alternative measures such as the median or geometric mean may occasionally be useful for very small data sets; however, in the present study, they did not outperform the arithmetic mean. The study also highlights the limited usefulness of individual theoretical distributions in the description of empirical metal accumulation data in the LGCD, mainly due to the large number of outliers.
FUNDING
This research was funded by the subsidy granted to the AGH University of Krakow by the Ministry of Science and Higher Education.
CONFLICT OF INTEREST
The Authors have no conflict of interest to declare.
METADATA IN OTHER LANGUAGES:
Polish
Rozbieżności między oszacowaniami średniej populacji w warunkach rozkładów prawostronnie asymetrycznych i obecności wartości anomalnych – na przykładzie zasobności metali w złożach Cu-Ag LGOM
zasobność metali, złoża Cu-Ag, rozkłady prawostronnie asymetryczne, wartości anomalne, symulacja Monte Carlo, miary tendencji centralnej
Zasobność metali w złożach Cu-Ag typu sedymentacyjnego w rejonie Lubina–Głogowa (LGOM, SW Polska) charakteryzuje się zazwyczaj silnie prawostronnie skośnymi rozkładami empirycznymi, zawierającymi liczne wartości odstające. Takie cechy komplikują zarówno dopasowanie rozkładów teoretycznych do danych empirycznych, jak i wybór właściwej miary tendencji centralnej – kluczowego parametru wykorzystywanego w szacowaniu zasobów. W prezentowanych wynikach badań ilościowo określono rozbieżności między oszacowaniami średniej w populacji zasobności metali, istotnej z punktu widzenia addytywnego szacowania zasobów, uzyskiwanymi przy użyciu pięciu powszechnie stosowanych miar tendencji centralnej – średniej arytmetycznej, mediany, średniej geometrycznej, średniej obciętej oraz średniej winsorowskiej – w warunkach silnej skośności i obecności obserwacji ekstremalnie wysokich.
Ogromne zbiory danych empirycznych pomiarów zasobności Cu, Co, Ni i Pb, uzyskane w wyniku opróbowania złoża w wyrobiskach górniczych kopalni Rudna, potraktowano jako populacje referencyjne, a ich średnie arytmetyczne przyjęto jako referencyjne przybliżenia średniej populacji istotnej dla addytywnego szacowania zasobów. Symulacje Monte Carlo wykorzystano do wygenerowania z rozkładów empirycznych zasobności każdego z metali 1000 niezależnych losowych próbek o rozmiarach n = 10, 20, 50, 100 i 200.
Zastosowano dwa kryteria oceny:
częstość, z jaką dany estymator dostarczał wartości najbliższej referencyjnej średniej populacji,
średnie względne odchylenie estymatora od tej wartości.
Średnia arytmetyczna konsekwentnie przewyższała pozostałe miary, a jej przewaga zwiększała się wraz z liczebnością próby. Średnia winsorowska zajmowała drugą pozycję, następnie średnia obcięta, natomiast mediana i średnia geometryczna były najmniej trafnymi estymatorami i systematycznie zaniżały referencyjną średnią populacji – często w sposób znaczny przy skrajnie silnej skośności i obecności bardzo licznych wartości ekstremalnie wysokich (szczególnie w przypadku zasobności Pb). Wyniki symulacji pokazały, że stosowanie średniej arytmetycznej skutkuje zaniedbywalnie małym błędem oszacowania referencyjnej średniej populacji (od –0,1% do 0,4%) podczas gdy przeciętne, relatywne niedoszacowanie tej wartości przez średnią geometryczną wynosi: –16,6% dla zasobności Cu, –29,4% dla zasobności Co, –18,3% dla zasobności Ni i –66,7% dla zasobności Pb.
Pomimo silnie skośnych rozkładów zasobności i licznych wartości odstających średnia arytmetyczna najczęściej dawała oszacowania najbliższe referencyjnej średniej populacyjnej zasobności metali przyjętej w tym badaniu. Wniosek ten odnosi się do ram addytywnego szacowania i nie musi automatycznie rozciągać się na inne opisowe zastosowania miar tendencji centralnej. Alternatywne miary, takie jak mediana lub średnia geometryczna, mogą okazać się przydatne w przypadku bardzo małych zbiorów danych, jednak w niniejszym badaniu nie przewyższały średniej arytmetycznej. Badanie podkreśla również ograniczoną przydatność indywidualnych rozkładów teoretycznych do aproksymacji zasobności metali w złożach LGOM.
REFERENCES (13)
1.
Auguścik-Górajek et al. 2021 – Auguścik-Górajek, J., Mucha, J., Wasilewska-Błaszczyk, M. and Kaczmarek, W. 2021. Problems of estimating the resources of accompanying elements: a case study from the Cu-Ag Rudna deposit (Legnica-Głogów Copper District, Poland). Minerals 11(12),
https://doi.org/10.3390/min111....
2.
Annels, A.E. 1991. Mineral Deposit Evaluation: A Practical Approach. Chapman & Hall.
3.
Bertoli et al. 2003 – Bertoli, O., Job, M., Vann, J. and Dunham, S. 2003. Two-dimensional geostatistical methods – Theory, practice and a case study from the 1A Shoot Nickel Deposit, Leinster, Western Australia. 5th International Mining Geology Conference.
4.
David, M. 1977. Geostatistical Ore Reserve Estimation. Elsevier.
5.
Glacken, J.J. and Snowden, D.V. 2001. Mineral resource estimation. In: Mineral Resource and Ore Reserve Estimation – The AusIMM Guide to Good Practice. AusIMM.
6.
Journel, A.G. and Huijbregts, C.J. 1978. Mining Geostatistics. Academic Press.
7.
Metropolis, N. and Ulam, S. 1949. The Monte Carlo Method. Journal of the American Statistical Association 44(247), pp. 335–341.
8.
Piestrzyński, A. ed. 1996. Monograph of the Lubin–Głogów Copper District (Monografia KGHM Polska Miedź S.A.)KGHM Polska Miedź S.A. (in Polish).
9.
Rock, N.M.S. 1988. Summary statistics in geochemistry: A study of the performance of robust estimates. Mathematical Geosciences 20, pp. 243–275,
https://doi.org/10.1007/BF0089....
10.
Rubinstein, R.Y. and Kroese, D.P. 2016. Simulation and the Monte Carlo Method (3rd ed.). John Wiley & Sons.
11.
Sinclair, A.J. and Blackwell, G.H. 2002. Applied Mineral Inventory Estimation. Cambridge University Press.