Technische Veröffentlichungen mit Bezug zu RV
Konfidenzintervalle für Quantile von Gaußverteilungen
In bestimmten Situationen, typischerweise wenn Konformitätserklärungen abgegeben werden müssen, müssen die Werte des Quantils einer Gaußschen Verteilung geschätzt werden. Während die Berechnung einer Quantilschätzung einfach ist, ist die Berechnung des damit verbundenen Konfidenzintervalls keineswegs einfach. Die Kenntnis dieser Art von Konfidenzintervall ist besonders dann erforderlich, wenn Konfidenzniveaus für Konformitätsentscheidungen verlangt werden, unabhängig davon, ob es sich bei den Spezifikationen um Mindest- oder Höchstgrenzen oder um charakteristische Werte handelt. Dieses Dokument enthält die technischen Grundlagen für ihre Berechnung, Tabellen mit Grenzwerten für Konfidenzintervalle, die nach der Monte-Carlo-Methode in Abhängigkeit vom gewünschten Quantil und Konfidenzniveau berechnet werden, eine Excel-Datei zur Berechnung dieser Werte, die Mindestanzahl der Werte, die für ein bestimmtes Konfidenzintervall erforderlich sind, sowie empirische Formeln zur Schätzung dieser Werte für die üblichen Werte des gewünschten Quantil und Konfidenzniveaus.
Vollständigen Text auf Englisch ansehen: Intervals of confidence on estimates quantile of a Gaussian distribution
Vollständigen Text auf Französisch ansehen: Intervalles de confiance sur les estimations de quantiles de distributions gaussiennes
Sicherstellung der Zuverlässigkeit von Unsicherheitsbestimmungen für Testergebnisse
Die Ergebnisse von CompaLab RV (Ringversuche) zeigen, dass die Unsicherheiten von den Teilnehmern deutlich unterschätzt werden. Es lässt sich eine Abstufung der Prüfmethoden feststellen, von hauptsächlich messtechnischen bis hin zu Methoden, bei denen die Quellen der Unsicherheiten hauptsächlich qualitativ sind. Bei den ersteren sind die Unsicherheiten insgesamt gut bestimmt, während sie bei den letzteren insgesamt um einen Faktor 10 oder mehr unterschätzt werden. Dies ist wahrscheinlich auf die massive Wahl der GUM-Methode B zu ihrer Bestimmung zurückzuführen, unabhängig von der Prüfmethode. Die Methode B ist jedoch in der Metrologie wirksam, aber nicht, wenn bedeutende qualitative Unsicherheitsquellen vorhanden sind. Dem GUM mangelt es auch an Leitlinien zu einigen prüfungsspezifischen Fragen. Darüber hinaus können die Ergebnisse der RV und der Qualitätsüberwachung im Labor für die GUM-Methode A wiederverwendet werden, die deutlich bessere Schätzungen der Unsicherheiten liefert und wesentlich weniger Zeit und Geld erfordert als die Methode B. Wenn eine genaue Bestimmung der Unsicherheiten wichtig ist, sollten gemeinsame Versuche nach Methode A (d. h. speziell konzipierte RV) organisiert werden, deren Ergebnisse anschließend in sehr wirksamen internen Qualitätsüberwachungsprogrammen verwendet werden können. Die Bestimmung von Unsicherheiten sollte immer mit einer Klärung des Verwendungszwecks und einer Sammlung verfügbarer Informationen über die Genauigkeit der Prüfung beginnen. Die am besten geeignete Methode zur Bestimmung der Unsicherheiten hängt in hohem Maße davon ab, und in den meisten Fällen lautet die Antwort nicht Methode B.
Vollständigen Text auf Englisch ansehen: Reliability of uncertainties of test results
Vollständigen Text auf Französisch ansehen: Fiabilité des déterminations d'incertitude
Ringversuche für Härteprüfungen: Interpolation der zugewiesenen Werte nach Ladungen
Es wird die Möglichkeit untersucht, in einer Laborvergleichsprüfung die Härteprüfungsergebnisse einer bestimmten Brinell- oder Vickers-Skala zu bewerten, wenn eine ausreichende Anzahl von Prüfergebnissen für benachbarte Skalen zur Verfügung steht. Es wurden 5 verschiedene Methoden zur Bestimmung des zugewiesenen Wertes und 2 verschiedene Methoden zur Bestimmung der Standardabweichung der Eignung, der Standardabweichung der Wiederholbarkeit und der Unsicherheit des zugewiesenen Wertes gefunden. Die beste Option hängt von den Bedingungen der Ringversuche ab. Es wird ein Verfahren beschrieben, das sich mit den verschiedenen möglichen Optionen befasst und Parameter vorschlägt, mit denen die Eignung jeder einzelnen Option überprüft werden kann, um die Wahl der am besten geeigneten Option zu erleichtern. Eine Bewertung der mit diesem Verfahren erzielten Ergebnisse an CompaLab RV-Ergebnissen aus den Jahren 2017-2023 wurde durchgeführt und führte zu sehr geringen Unterschieden in der Bewertung der Teilnehmer für die verfügbaren Skalen. Wenn die Größe der Eingabedaten groß ist, ist das Output-Scoring wahrscheinlich sogar effizienter als das übliche.
Vollständigen Text auf Englisch ansehen: ILC about hardness: Interpolation of VA according to load
Vollständigen Text auf Französisch ansehen: CIL de duretés : Interpolation des VA selon les charges
Geeignete Rankits für Normalwahrscheinlichkeitsdiagramme und Standardabweichungswahrscheinlichkeitsdiagramme
Normalwahrscheinlichkeitsdiagramme werden in der Regel verwendet, um zu prüfen, ob eine Verteilung als gaußförmig angesehen werden kann, um zu veranschaulichen, ob einige Zahlen wahrscheinlich Ausreißer sind, und um mit Hilfe einer linearen Regression ihren Mittelwert und ihre Standardabweichung zu schätzen. In gleicher Weise können "SD-Wahrscheinlichkeitsdiagramme", die auf der Verteilung der Standardabweichungsschätzungen basieren, sehr nützlich sein, um ähnliche Ziele zu erreichen: prüfen, ob eine Homoskedastizitätshypothese akzeptiert werden kann oder nicht, Schätzungen visualisieren, die wahrscheinlich Ausreißer sind, und die wahre zugrunde liegende Standardabweichung schätzen. In der Praxis ist eine Änderung der Variablen erforderlich, um den Rang jedes Wertes in eine entsprechende kumulierte Wahrscheinlichkeit und eine inverse Gauß-Transformation umzuwandeln, um einen "Rangit" zu erhalten, der als Ordinate für diese Diagramme verwendet werden kann. Gleichungen in der Form (i-a)/(N+1-2a) mit 0 ≤ a ≤ 1 werden in der Regel zur Bestimmung der geeigneten kumulierten Wahrscheinlichkeiten verwendet. Tatsächlich hat die Wahl des "a"-Wertes, zumindest für kleine Werte von N, einen großen Einfluss auf die später gezogenen Schlussfolgerungen. Dieses Dokument:
- Erörtert die Gründe für diese Gleichungen;
- Bewertet ihre Angemessenheit für eine Reihe von Situationen und Arten von Verteilungsgesetzen;
- schlägt Gleichungen zur Bestimmung von "a"-Werten als Funktion von N vor, die bessere Rangordnungen als die üblicherweise verwendeten liefern und es ermöglichen, Mittelwerte und/oder Standardabweichungen ohne Verzerrungen für eine Reihe von Situationen zu schätzen;
- schlägt eine genaue Methode zur Bestimmung der Hüllkurven des Vertrauens für Normalwahrscheinlichkeitsdiagramme und Wahrscheinlichkeitsdiagramme einer beliebigen Verteilung vor, deren kumulative Funktion bekannt ist.
Vollständigen Text auf Englisch ansehen: Appropriate rankits for normal probability plots
Vollständigen Text auf Französisch ansehen: Rankits appropriés pour diagrammes de probabilités cumulées
Betarisiken bei Eignungsprüfungen
Zusammenfassung:
Die Monte-Carlo-Methode wurde auf Studienpläne für Eignungsprüfungen (EA) angewendet, um deren Effektivität zu untersuchen. Die Wahrscheinlichkeiten, dass die berechneten z-Werte größer als 3 sind, während der tatsächliche Wert kleiner als 2 ist, und dass die berechneten z-Werte kleiner als 2 sind, während die tatsächlichen Werte größer als 3 sind, wurden für eine Reihe unterschiedlicher Situationen berechnet: Anzahl der Teilnehmer von 5 bis 30, unterschiedliche Verhältnisse von Wiederholbarkeit zu Reproduzierbarkeit und Anzahl der Testergebnisse pro Teilnehmer, Einführung oder Nicht-Einführung von Ausreißern mit z-Werten von 3,5 bis 10. Für jede Situation werden die Wahrscheinlichkeiten diskutiert, dass echte Ausreißer nicht erkannt werden und dass Fehlalarme ausgelöst werden. Es werden Ratschläge und Schlüssel zur Überprüfung und Verbesserung der Effektivität von realen EA-Programmen vorgeschlagen.
Zusammenfassung der Schlussfolgerungen :
- Das Verhältnis λ=σr/(σL×Nr) ist für die Kontrolle der Effizienz eines EP-Schemas (EP: Eignungprüfung) von größter Bedeutung, sogar noch mehr als die Anzahl der Teilnehmer. Die EP-Anbieter sollten sich dann um Nr kümmern, die Anzahl der Testergebnisse pro Teilnehmer, die sie anfordern;
- Selbst unter ungünstigen Bedingungen ist das α-Risiko immer sehr gering (weniger als 0,7 %);
- Robuste Algorithmen verbessern die Effizienz des EP-Programms (d. h. das β-Risiko) auf Kosten des α-Risikos (das immer sehr niedrig bleibt). Dies ergibt sich aus einer deutlich besseren Schätzung der Standardabweichung der Referenz, wenn ein Ausreißer unter den Teilnehmern vorhanden ist und wenn diese robusten Algorithmen verwendet werden;
- Eine Anzahl von 6 Teilnehmern ist groß genug, um einen stark abweichenden Teilnehmer zu erkennen, vorausgesetzt, dass gute EP-Bedingungen (d. h. ein niedriger Wert von λ) gegeben sind;
- EP mit einer geringen Anzahl von Teilnehmern ist (fast) immer besser als gar keine EP.
Die Referenznormen ISO 5725-2 und ISO 13528 empfehlen, keinen Ringversuch mit weniger als 12 Teilnehmern zu organisieren. Dies ist sinnvoll für ISO 5725-2, deren Ziel es ist, die Leistungsfähigkeit eines Prüfverfahrens zu bestimmen. Für die ISO 13528, deren Ziel es ist, die Leistungsfähigkeit eines Labors zu überprüfen, ist es weniger sinnvoll. Es ist offensichtlich, dass das β-Risiko 100% beträgt, wenn keine EP organisiert wird: ein Labor, das ein Problem hat, kann es überhaupt nicht erkennen! Folglich ist es für Prüfverfahren, die von einer kleinen Anzahl von Labors durchgeführt werden, offensichtlich besser, eine EP mit 6 Teilnehmern zu organisieren als gar keine. In diesen Fällen sollte der EP-Anbieter besonders auf die Anzahl der Testergebnisse pro Teilnehmer achten, die er anfordert, um einen angemessenen λ-Wert zu gewährleisten und folglich eine möglichst gute Effizienz sicherzustellen.
Vollständigen Text auf Englisch ansehen: Beta risks in proficiency testing
Vollständigen Text auf Französisch ansehen: Risques béta lors d'essais d'aptitude
Entsprechende wissenschaftliche Publikation (auf Englisch)